今週の生成AI関連ニュース | 2026年03月 第2週 | ChatGPT-5.4公開!、Claudeが他社による大規模蒸留を不正行為として警告、ClaudeCodeにコードレビュー機能が実装!など
こんにちは。
株式会社インテグラル 開発チームのMkimaです。
2026年03月第2週の生成AI関連情報をお届けします。
※この記事には生成AIによる要約・コメントが含まれます。
💡OpenAIがGPT-5.4を公開(3/5)
ニュース概要
OpenAIは3月5日、日本時間で新モデル「GPT-5.4」を公開しました。
推論、コーディング、エージェント型ワークフローを一つにまとめ、最大100万トークンのコンテキスト処理やPC操作能力を備えるのが特徴です。
ChatGPTとCodexで段階的に提供が始まり、Plus、Team、ProではThinkingモード経由で利用できるほか、ProとEnterprise向けには最上位モデル「GPT‑5.4 Pro」も用意されています。
考察・コメント
先週から公開されたGPT-5.4ですが、思考のプロセスを逐一報告するようになったので、検討の方向性が違っているときにフォローアップがしやすくなったと感じます。
また、単価は上がったもののトークン効率が向上したので総トークン使用量は抑えられるという説明もあり、今後は性能競争だけでなく、どこまで実務コストを下げられるかが勝負になりそうです。
🛡️複雑な脆弱性を推論、実用性の高い修正を提案する「Codex Security」リサーチプレビュー版として公開(3/6)
ニュース概要
OpenAIは2026年3月6日、AIセキュリティエージェント「Codex Security」をリサーチプレビューとして公開しました。
これはコードベースを解析し、脆弱性の発見、妥当性の検証、修正案の提示までを一連で支援する仕組みです。
リポジトリの構造やプロジェクト固有の脅威モデルを踏まえて検出結果を分類し、サンドボックス環境で検証することで誤検知を抑える点が特徴とされています。
OpenAIはベータ運用でノイズ84%削減、重大度の過大報告90%超削減、誤検出率50%超削減と説明しており、ChatGPT Pro、Enterprise、Business、Edu向けにCodex web経由で提供すると案内しています。
考察・コメント
「脆弱性を見つけるだけのツール」ではなく、検出結果の検証と修正提案までを同じ流れで扱い、実務上の手戻りや確認負荷が減らせる点が重要だと感じます。
従来の静的解析では、誤検知や優先度判定の負担が大きいことが課題でした。「Codex Security」は、脅威モデルを踏まえて実害ベースで分類し、検証環境で確かめる設計とすることでこの課題を克服しています。
一方で、最終的な安全性判断をAI任せにするのは危険であり、当面の用途としては「レビュー対象を絞り込むこと」に留めるべきかと思います。
💡GoogleがGemini 3.1 Flash-Liteを公開(3/3)
ニュース概要
Googleは2026年3月3日、Gemini 3系の新モデル「Gemini 3.1 Flash-Lite」を発表しました。
Google公式ブログによれば、本モデルは高頻度・大規模な開発者向け処理を想定した、同社で最も高速かつ低コストのモデルと位置付けられています。
Google AI StudioのGemini APIおよびVertex AIでプレビュー提供され、料金は入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルです。
2.5 Flash比で初回応答速度が2.5倍、出力速度が45%向上したとされ、翻訳、コンテンツモデレーション、UI生成、ダッシュボード作成などを主要用途として挙げています。
考察・コメント
今回はスペックの増強というよりは、処理をいかに安価かつ高速に回すかに重点を置いたアップデートという印象です。
特に、推論量を調整できる仕組みを標準搭載しつつ、翻訳や監視のような大量処理から、UI生成やマルチステップ作業まで一つの軽量モデルで担わせようとしている点が象徴的だと感じます。
🏢Anthropic、Claudeの「大規模蒸留攻撃」を確認──DeepSeek・Moonshot・MiniMaxが不正抽出、約2.4万アカウントで1600万超のやり取り(3/4)
ニュース概要
Anthropicは2026年2月23日、Claudeの能力を不正に抽出する「産業規模」の蒸留攻撃を確認したと公表しました。
対象としてDeepSeek、Moonshot AI、MiniMaxの3社を挙げ、約2万4,000件の不正アカウントを通じて1,600万件超の対話が行われたと説明しています。
各社は推論、ツール利用、コーディング、視覚機能、思考過程の抽出などを狙っていたとされ、Anthropicはこれを利用規約違反かつ地域制限回避を伴う不正行為と位置付けています。
加えて、検知強化、本人確認、他社や当局との情報共有を進める方針も示しました。
考察・コメント
蒸留そのものは一般的な学習手法ではあるのですが、他社モデルの出力を大規模かつ継続的に収集し、自社モデル強化へ流用する行為は、競争上・安全保障上の問題になりかねません。
特にAnthropicは、不正蒸留で作られたモデルでは元モデルの安全対策が十分に継承されず、危険な能力だけが拡散する可能性を強調しています。
現時点では主張の中心がAnthropic側の公表に依拠しているため、事実認定や法的評価については今後の第三者検証や各社の反応も踏まえて見る必要があります。
💡Google Docs, Sheets, Slides, Driveに新たなGemni機能を統合(3/10)
ニュース概要
Googleは2026年3月10日、GeminiをGoogle Workspaceにさらに深く組み込み、Docs、Sheets、Slides、Drive向けの新機能をベータ提供すると発表しました。
・Docs:GmailやDrive、Chatの情報を参照して下書きを生成し、文体や書式の統一も支援。
・Sheets:指示だけで表や管理シートを作成し、「Fill with Gemini」で要約・分類やWeb情報の補完が可能に。
・Slides:既存デッキに合う編集可能なスライドを生成可能に。
・Drive:検索結果上部に出典付きのAI概要を表示し、文書横断の質問にも応答。
対象はまずGoogle AI Ultra/Pro契約者で、Docs、Sheets、Slidesは英語でグローバル提供、Driveは米国提供です。
考察・コメント
Googleとしては、Geminiを単なるチャットアプリではなく、Workspaceに統合したアシスタントとして発展させていきたいねらいが垣間見えます。
特に、メール・ファイル・チャット・Web情報を横断して下書き作成、表作成、スライド生成、検索要約まで完結させるフローになっている点は、ユーザーの作業工数を大きく削減するという意味で有意義なアップデートであると感じます。
💡AnthropicがClaude Codeに高度な「Code Review」機能を追加(3/11)
ニュース概要
Anthropicは2026年3月9日、Claude Codeに高度なコードレビュー機能「Code Review」を研究プレビューとして追加しました。
これはプルリクエストごとに複数のAIエージェントを動かし、並列にバグを探索しつつ、誤検知を減らすための検証と深刻度の順位付けまで行う仕組みです。
規模の大きい変更にはより多くのエージェントを割り当て、小規模な差分には軽量な確認を行う設計で、Anthropic社内では平均20分程度、1回あたり概ね15〜25ドルで運用されているとされています。
TeamおよびEnterprise向けにベータ提供され、人間の承認判断そのものは置き換えない位置付けです。
考察・コメント
Anthropicは、社内では従来16%だった実質的なレビューコメント付きPRが54%まで増えたと説明しています。
また、大規模PRの84%で指摘が見つかり、誤り判定は1%未満としています。
ただし、平均20分・15〜25ドルという特性から見ても、常時すべてを自動化する汎用レビューというより、高リスクな変更や複雑な差分に重点投入する用途が現実的と思われます。
「Codex Security」と同様に、当面は人間によるレビューを不要にするものではなく、見落としを減らす補助者として活用するのがよさそうです。
今週の生成AIニュースは以上です。また来週お会いしましょう。
