LLM雑記 Geminiとか

雑記

Geminiを契約しつつ、たまに無料のChatGPTを使ってるけど、まあ一長一短?
Gemini 2.5 Proの「短」の部分を実感していないというのが正直なところ。

GeminiがだいたいChatGPTの6～7割くらいの値段であること(via workspace)
Deep Researchがたくさん使えること
Gem（システムプロンプトとか知識とか設定しておける奴）が結構使えること
Canvasもそこそこ便利

あたり加味して、まあGeminiでいいんじゃないかな、とは思っています。コードもそこそこ書ける。Canvasについては、コードが長くなって途中部分を勝手に省略され始めると、徐々に整合性が崩れていく印象です。まあ、本格的にコード書くならVSCode拡張機能とか、CLI系を使うだろうし、まあよいでしょう。
最近は特にGemを使い倒していて、特定の用途に絞って使いたいときに絶大な労力削減をもたらしてくれます。性能もそこまで文句はありません。というかそもそもLLMに過度に高度なことを期待する方が悪いよね。

ということで、当面はGeminiを普段使いしようかなと。あまりに使いすぎる/長いコードとか渡しまくると、ごくまれに上限に達しますが、その時は電子機器の使いすぎということでいったんスマホを置きましょう。

あと、GeminiはGoogle Workspaceとの連携がちょっとずつ便利になってきている気がします。まだだいぶガッツリと使うには厳しいことが多いものの、例えば表の集計をする数式をスプレッドシートで書いてもらう、とかは結構いけます。
PDFをまとめさせたものをGoogle Documentに簡単にエクスポートできるのもGoodだけど、数式とかがちょっと不安定な印象です。
まあ、現段階ではお試しの段階かな、と。

GUIの方ではこんな感じだけど、CLIの方はどうかというと、これもだいたい使うときはGemini CLIを使っちゃってます。
まあ、数多あるAI Agentの一つではあるけど、やはりAPI無料枠が大きいのがすごくうれしい。だいたい無料枠を使い切るころには疲れているので、素直に翌日まで寝ましょう。
あと、CLIの表示が安定しているのがとても良い。環境依存かもしれないんだけど、以前Claude Codeを使ったときは、ウィンドウの切り替え/リサイズとかに合わせてCLIの表示が暴走したり、スクロールできなくなったり、いろいろあった。あれさえなければ継続利用の選択肢に入れたのになぁ・・・

AGIはなぁ・・・

「汎用人工知能」というネーミングがよくないよね。特に「汎用」と「知能」。
ただ人間の言語を真似して喋れる、特定のケースで特定のそれっぽい文字列で出力できる、というだけで知能かといわれると、まあ違うんじゃないかと。LLMからもう10歩くらいは進まないとね。
そもそも、人間の知能が言語のみで表現されるわけ?

学術的とか、何か体系的に語りたいというのであれば、まあ言語という「知能」が表に出てくるところにフォーカスするのは自然だとは思うけども。
それでも非言語部分の知能というのは確かにあると思っていて、つまり言語って知能の一側面だと思っています。だから、言語を真似できるからと言って知能とは思えないよね。
まあ、正直信念とかの領域なので、議論する類のものじゃないんですが。

結論から言うと、チューリングさんが悪い。反省して下さい。（暴論）

LLMの性能って何なの?

正直指標がよくわからな過ぎて、性能主張したもん勝ちみたいなもんじゃない、と思ってしまいます。
論文にはずらずらと指標大量に並べて、やれこの性能がいいとか書いてるけど、タケノコみたいにポコポコ生えてくる論文がどれだけ信頼できるか一般人じゃ分かったもんじゃないよ。

「その技術はどう実社会に役立つのですか」みたいなゴミ質問を提示するつもりではないんだけど、一体LLMはどこに行くんでしょうね。性能勝負からコスト勝負に行くのかな?
人間の言語表現の模倣という意味ではもう一定程度できているといってもいいかもしれないけど、個人的には「Intelligence」であるとは思わないんだよね。それっぽい言葉は出力できました。音声も合成できます、画像とか動画の解釈&生成もできます。で、それは知能なの?ということですね。「はい、それは知能です」と主張されたらその時はその時、こちらから言うことは何もありません。

ということで、AIという単語は宗教上あまり使いたくないのですが、世間の人々はAIが大好きなので、仕方なく私も機械学習ではなくAIという単語を使っています。
「機械学習を用いた」というよりも「AIを活用した」というほうが、聞いている皆さんが喜ぶからね。

仕方ないね。