ChatGPTと論文本気読み合わせ

ChatGPTと論文の本気読み合わせをやった(https://chat.openai.com/share/869125d7-6f15-415a-9f22-7028a9e15650)。議論が盛り上がると楽しい。でも結局、いわゆる壁打ちというか、殴り合わないと何のプラスにもならない。ただ要約させるだけじゃ何にも入ってこないので、それなら隅から隅まで精読した方がいい。というか読み合わせっていうぐらいだから俺自身も並行して読むし、論文の読解のために使うとしたらお互いの理解をぶつけ合うことでしか活用できないように思う。問題はとにかくだらだら喋ること。

ChatGPTのpublic linkで共有してもいいようにarXivに上がってる論文でやったけど、結局のところPDFから逐一全部コピーして流し込むのが本当にめんどくさい。PythonでPDF-to-textとか使ってうまくテキストにバラして流し込む機構を作りたいものだけど、APIで利用するのめんどくさいんだよな。可読性も落ちるし。これからは論文もepubとかになっていくんかな。俺みたいな弱視人間は一般の人向けの固定レイアウトのものはかなり読みづらいんですよね。

本気読み合わせとは言っても、ChatGPTの返答能力を試すためにアホを演じた部分もあるのでそんなには怒らないでください。普通にテストデータでcross-validationやってんのに俺の意見に流されてやってないかもとか言ってるの草なんですよね。最適化も最終的にはAdam使ってることも書いてあったし。

冒頭の指示が経時的にだんだん忘却されていく感じがいかにも機械学習だなって感じなんだけど、その辺りはCustom Instructionsに指定しておくことで常に”意識させる”ことができるだろうし、その辺は要改善かな。(ちなみに現状のCustom Instructionには僕がこの”Assistant”のことをエヴァと呼ぶことだけが伝えてあって、これは僕が極めて好きな映画『エクス・マキナ』の人工知能ロボット”Ava”に由来する)

そして、この議論スレッドを各論文ごとに進めていくとすぐ管理が面倒になるわけだけど、いくらスレが増えたからといってこれだけのボリュームの議論を丸ごと消すのももったいない。なので一通りの議論が終わった時点でページ全体をPDFにでも吐き出して、それを文献管理ソフト(僕の場合はReadCube Papers)にでも添付しておけばいい。特にPapersの場合は一つの文献に対して複数のPDFファイルを添付できるので、論文本体のPDFとは別にこういう追加のファイルをくっつけておくのが得策だろうと思う。

https://chat.openai.com/share/869125d7-6f15-415a-9f22-7028a9e15650