yhkondo
@yhkondo
フリーの日本語研究家。日本語文法書・日本語辞書の構築を目指してツイートしています。日本語の言語学的研究、文学研究のためのコンピュータ利用も研究しています。近時は、明治期聖書の研究も行っています。http://twilog.togetter.com/yhkondo
JOSSの国会図書館セッションでのスライドをアップロードしました。 speakerdeck.com/yhkondo/jos202… 『大日本国語辞典』(冨山房)をOCRデータから復元して、MCPサーバーとしてAIから利用する話です。将来は、みんなが、推しの古典的辞書や自作辞書をMCPサーバーとして公開して、AIから使うことを夢想中。
今までは、DH(デジタル人文学)をやるには相当の学習の時間的コストがかかるので、それ専門になりがちな部分もあったが、AIの発達で劇的にコストが下がってきたので、今後は、従来型の研究+DHの両刀使いが十分に可能だと思うし、そういう方向になっていくだろう。久保田淳がAIを駆使するイメージ。
9月13日(土)午後に神奈川大学(みなとみらい)で、「主語を究める」と題したシンポジウムがあります。当該校の先生方に加えて、下地理則氏(九大)と私が参加します。私は「コンピュータ分析から見た主語」のタイトルです。プログラムと参加申込みは下記。参加無料です。gsfl.kanagawa-u.ac.jp/news/25071401.…
言語習熟論学会からのメールが来た。新会長の矢澤真人氏のエッセイだが、中国の大学の外国語学部で講演をしてきたが、先生方が、大学当局から、「AIで授業をする・AIを使うサービスを開発する・AIそのものの研究をする」のどれかをするよう言われているという。中国AIの開発が速いわけだが、大変だ。
先日行われた Japan Open Science Summit 2025 国立国会図書館主催セッション「AI×文学研究の可能性を探る」の発表資料と動画が、国会図書館サイトで、公開されています。青池亨、北本朝展、黄晨雯、日比嘉高の各氏、そして近藤の発表となっています。lab.ndl.go.jp/event/joss2025/
やはり、知識系は、RAGがダイレクトに能力を上げられる。しかも、最近の技術を使って仕上げてあると強い。かの「からまる」君も、江戸時代語LLMの上に、同じ学習データをRAGでさらに被せると、より当時のことに強くなると思うのだが、どうだろうか。
Aozoraもようやく公開できました。青空文庫の著作権がない約1,000名の著者17,000作品が対象です。大量のデータから適切な文脈を抽出するため、クエリ拡張やハイブリッド検索、リランキングなど、色々と工夫してます。是非試してみて、面白い生成を共有下さい〜。
Aozoraもようやく公開できました。青空文庫の著作権がない約1,000名の著者17,000作品が対象です。大量のデータから適切な文脈を抽出するため、クエリ拡張やハイブリッド検索、リランキングなど、色々と工夫してます。是非試してみて、面白い生成を共有下さい〜。
【新サービス公開】 青空文庫RAGチャット「Humanitext Aozora」を本日リリースしました! 「『こころ』の先生の動機は?」といった質問はもちろん、「芥川龍之介の文体で『羅生門』の続きを書いて」といった創作まで、4つのモードで楽しめます。 皆さんの"推し"の文豪と話してみませんか?…
試してみたが、非常に「頭のいい」説明をしてくれる。単なる作品の要旨に留まらず、文学的意義等を、作者の他の文献なども調べて回答するところが優れている。お薦めです。
【新サービス公開】 青空文庫RAGチャット「Humanitext Aozora」を本日リリースしました! 「『こころ』の先生の動機は?」といった質問はもちろん、「芥川龍之介の文体で『羅生門』の続きを書いて」といった創作まで、4つのモードで楽しめます。 皆さんの"推し"の文豪と話してみませんか?…
チームみらいも一議席とってくれてこれから面白くなりそうですね。これからソブリンAIの重要性もますます増してきそうです(ポジショントーク)
反グローバライゼーションとしての右傾化が日本でも本格化してきた。このあとのIT世界の大問題は、AIがこの中でどういう立ち位置で働くかだ。AGIに近い人工知能が今年、来年の内に出現するわけだが、それらは、この流れを助長するのか、和らげるのか。AIが本当に超強力なら、影響力があるだろう。
若尾政希『書物の時代 読書がひらいた日本近世』(岩波書店)の書評を、日経新聞に寄せました。 タイトルからは想像つかない、超ダイナミックな本です。 日本語を話す人々が、同じ情報に接し、同じようなことを考えるようになるルーツをたどります。 それが江戸時代の出版業だと本書は言います。
AIがプログラムを書いてくれるようになって助かっている。自力だけでできる能力は低下するが、70歳という自分の年齢を考えれば、自力でやっていてもせいぜいあと10年がいいとこ。それよりも、AIでのコーディングをメインにしていけば、80歳を過ぎても十分にDH分野の研究は可能だろうと確信している。
数日前にGoogleの要約AIのNotebookLMにオフィシャルコンテンツとして、シェークスピア全集等が公開されたというニュースがあった。シェークスピア全集にアクセスしてみると、日本語での問い合わせも可能だ。この方向も、いろいろな可能性があるように思う。notebooklm.google.com/notebook/19bde…