技術 | パズルが好きなだけの人

「Native Messaging」という技術でChrome拡張機能からpythonスクリプトを動かしました

導入リンクの動画や音声をmp3でダウンロードするPythonスクリプトを昔作ったのですが、使うたびにURLをCUIにコピペするのがどうも面倒。なので、ブラウザのボタン一つで実行できる機能を実現できないか試しました。結論から言うと無事動作...

2025.07.30

技術

pyenv-winで環境構築したい音声再生を伴う簡単なアプリを作りたいと思ったのですが、WSL2上からだとどうも音声出力が面倒。仕方ないので、全く同じ環境をwindows上で再現しようと思い、windows版のpyenvを使って綺麗な環境...

2025.07.10

技術雑記

拡張機能を作ってみたふと思い立って、拡張機能を公開してみることにしました。内容は、Geminiのチャット全文をhtmlとMarkdownとjsonにエクスポートするというシンプルなものです。ここで公開しています。試しにオープンソースにして...

2025.06.21

技術雑記

YMM4 先日合成音声を初めて触ってみたのをきっかけに、簡単に字幕も作れるゆっくりムービーメーカーを触ってみています。(別にどういう動画を作りたいかというイメージはないんですが・・・)通常のボイスロイドなら何も工夫せずとも動きますが、例えば...

2025.05.14

技術

PDFを翻訳して並べてほしい最近PDFのテキストで学習しているのですが、全部で何百ページもあり、英語であることもあり目が滑ってしまいます。せめて日本語翻訳したものが横にあるだけでも違うのではないかと思い調べてみたところ、処理時間自体は多少...

2025.05.13

技術

メディアプレイヤーがカバー画像を表示してくれない！フォルダ内の各音声ファイルにカバー画像を埋め込んで、アルバム名とトラック名を設定して、フォルダ内にcover.jpgも配置して・・・なのにメディアプレイヤーでは画像が表示されない！なにゆえ...

2025.05.12

技術雑記

はじめに試してみました。当方環境ではpytorchもCUDAも何もかも推奨バージョンとは違うので、まあ動かなそうだなと思いつつもやってみました。モノとしてはだいたいGPT-SoVITSをそのまま使っていているようですね。WSL環境です。 ...

2025.03.16

技術

はじめに久しぶりにゴルフの打ちっぱなしに行ったんですが、自分のスイングを撮影してみたらあまりにも不格好でした。そこでふとスイングを分析できないかと思い、MMPoseというものを使用してみることにしました。これにはpytorchとかnvc...

2025.03.08

技術

VPNとWSL2 最近、wsl2上で動かしているpythonからrequests.get()を使う機会がありました。そのときに、通常時は問題なく動くものの、VPN接続時にrequests.get()から進まなくなる問題があり、少し調べたのち...

2025.01.04

技術

Ollama動かしてみた話ほかの記事ではOllamaをとりあえず動かしてみました。この記事ではCLIで叩いていましたが、pythonから利用できればより便利そうです。にollamaをpythonから叩けるものがあるので、利用してみます。 ...

2024.08.04

技術