最近発表されたgpt-oss(前のブログは「ここ」)なんだけど、これのWebブラウジング機能について前々から興味があったので、ちょっと使ってみた。
LM StudioやOpenWebUIなど、いろいろと試してみたんですけど、ollamaのGUIアプリで実現できました。
これは機能呼出(Function Callingとかtoolsという)でWebブラウジングを行うんだけど、通常はPythonやJavaScriptのライブラリでOpenAI APIやollama APIを使って、Webブラウジングの機能を呼び出すんだけど、ollamaの場合は最近出たGUIアプリにWebブラウジングのバッジがあってそれをオンにするだけで呼び出してくれる。
ちなみに以下がバッジをオフの状態で使ったもの(画面では手違いで、青くオンになっちゃってます😓)

なんだか、、、、おそらくボーダーハリーっていう洋服のブランドがあるんでしょうね。プレトレーニング(事前学習)した内容のようですね。
そして、Webブラウジングをオンにした内容が以下です。



や、やばいわぁ、、、むっちゃ整理されている。
実務でも使えるレベルだわ。。。
これがローカル(Web閲覧はしてるけど)で動いているって、凄くないですか!?
プロンプトを入力すると色々と処理している過程が以下のように表示されています。





【⚠️注意】このWebブラウジングの機能だけど、どうやって僕のホームページにアクセスしているのかが気になって、Webサーバのログを確認したんだけど、実はこのollamaのGUIアプリから(自宅から)じゃ無くて、外部の検索エンジンやプロキシからアクセスが来ていました。なので、呼ばれたファンクション内の処理で外部の検索サーバへ情報取得を依頼しているようです。なので、依頼情報の取り扱いは注意⚠️が必要ですね。
今度は、Open AIのAPIを使ってローカルで動くアプリを作りたいな、と思う今日この頃です。
もうちょっと、プロンプトエンジニアリングとLLMエンジニアリング(Function Calling、RAG、ファインチューニング)を勉強しないといけないなぁ😅(詳細は「ここ」です。)