プログラミング研究所

投稿

4月, 2026の投稿を表示しています

Project AnalyzerがPowerPointに対応！さらにOfficeファイル内の画像からテキストを抽出するOCR機能を追加！

4月 25, 2026

【アップデート】Project AnalyzerがPowerPointに対応！さらにOfficeファイル内の画像からテキストを抽出するOCR機能を追加！こんにちは！AIにプロジェクトの全貌を読み込ませるためのツール「 Project Analyzer 」をアップデートしました。（前回の記事： AIにプロジェクトを読ませる「Project Analyzer」がNotebookLMに完全対応＆ファイル個別出力も可能に！）前回のNotebookLM向け最適化に続き、今回はドキュメント解析の精度と対象範囲を大きく広げる機能追加を行いました。特に開発現場でよく使われるOfficeファイルへの対応を強化しています！ 🚀 今回のアップデート内容（新機能） 1. PowerPoint（.pptx）ファイルの解析に正式対応これまでExcelやWordの読み込みには対応していましたが、今回新たに PowerPointファイル（.pptx）からのテキスト抽出に対応しました。要件定義書やシステム概要図、プレゼン資料など、PowerPointで作成されたドキュメントも、AIが読み込みやすいマークダウン形式として出力できるようになります。 2. Officeファイル内の画像に対するOCR（光学文字認識）対応 Excel、Word、そして今回追加されたPowerPointファイルの中に「画面キャプチャ」や「画像化された図表」が貼り付けられていることはないでしょうか？これまでのテキスト抽出では画像内の文字は取得できませんでしたが、今回のアップデートで OCR機能を搭載しました！ 💡 OCR機能のメリットドキュメントに貼り付けられたエラー画面のキャプチャや、スクショベースの手順書などからテキストを自動抽出し、マークダウンの出力結果に含めることができます。これにより、テキスト化されていなかった情報までAIに連携可能になります。 ⚠...

ローカル環境で「Gemma4」を動かしてみた！

4月 19, 2026

ローカル環境で「Gemma4」を動かしてみた！e4bと26bの精度やコーディング・自己デバッグ能力を検証こんにちは！今回は、ローカル環境で実行可能な大規模言語モデル「Gemma4」の動作検証を行いました。パラメータサイズの異なる「Gemma4 e4b」と「Gemma4 26b」の2つのモデルに対して、日常的な会話や長文の要約、そして実践的なC#のプログラミングタスクを与えてみました。特にプログラミングの検証では、「AIが書いたコードでエラーが出た際、エラーメッセージをそのまま返して修正できるか（自己デバッグ能力）」という実践的なやり取りも試しています。それぞれのインプットとアウトプットをまとめましたので、ローカルLLMの導入を検討している方の参考になれば幸いです！ 💬 1. Gemma4 e4b の検証：日常会話と文章要約まずは軽量な「Gemma4 e4b」モデルに対して、基本的な会話とニュース記事の要約をお願いしてみました。 👤 インプットこんにちは、何ができますか？ 🤖 アウトプットこんにちは！私はGoogle DeepMindによって開発された大規模言語モデル、Gemma 4です。私にできることは多岐にわたりますが、主な能力は以下の通りです。質問への回答: 幅広いトピックに関する情報を提供したり、疑問にお答えしたりできます。文章の生成: ブログ記事、メール、物語、詩など、様々な形式のテキストを書き起こすことができます。要約: 長い文章や記事の内容を分かりやすく短くまとめることができます。翻訳: 異なる言語間の翻訳をお手伝いできます。（ただし、得意な言語は日本語と英語などです）アイデア出し・ブレインストーミング: 何か企画を立てる際や、行き詰まった時のアイデアの提供ができます。 ...