技術 gpt-oss-20b + vLLM + RTX5090で数百Token/sくらいは出た
はじめに いいPCを買ってしまいました。嬉々としてスペック自慢できるタスクを回しています。今回はGPT-OSS-20bがRTX5090環境でどのくらい爆速になるのか見てみました。 ついでに、極めて楽にvLLMでgpt-oss-20bを動かす...
技術
雑記
雑記
技術