LLM

技術

gpt-oss-20b + vLLM + RTX5090で数百Token/sくらいは出た

はじめに いいPCを買ってしまいました。嬉々としてスペック自慢できるタスクを回しています。今回はGPT-OSS-20bがRTX5090環境でどのくらい爆速になるのか見てみました。 ついでに、極めて楽にvLLMでgpt-oss-20bを動かす...
雑記

LLM雑記 Geminiとか

雑記 Geminiを契約しつつ、たまに無料のChatGPTを使ってるけど、まあ一長一短?Gemini 2.5 Proの「短」の部分を実感していないというのが正直なところ。 GeminiがだいたいChatGPTの6~7割くらいの値段であること...
雑記

ChatGPT/Geminiが書くMarkdownが崩れるのを防ぐ小技

いつも表示が崩れる LLMにコードを説明してもらったりするとき、しょっちゅう出力が崩れます。Markdown内のバッククォート三つとかが干渉してしまうからですね。 小技 解決策: バッククォート4つで囲んだコードブロック内にMarkdown...
技術

PDFを翻訳して英語版と日本語版を並べて表示したいときの最適解

PDFを翻訳して並べてほしい 最近PDFのテキストで学習しているのですが、全部で何百ページもあり、英語であることもあり目が滑ってしまいます。せめて日本語翻訳したものが横にあるだけでも違うのではないかと思い調べてみたところ、処理時間自体は多少...