2026年3月25〜26日、AI業界では半導体・AIモデル・開発ツール・政策の各領域で大きな動きが相次ぎました。英Armが35年の歴史で初めて自社設計したAI専用チップ「AGI CPU」を発表しMetaを初顧客に獲得する一方、OpenAIはわずか6ヶ月でAI動画生成アプリ「Sora」のサービス終了を決定し、ディズニーとの10億ドル超のライセンス契約も破談となりました。開発者向けにはAnthropicがClaude Codeに「オートモード」を追加し、毎回の承認なしにAIが安全チェックしながら自律的にコーディング作業を実行する新時代が幕を開けています。
政策面では、トランプ大統領がAI科学技術諮問委員会(PCAST)にザッカーバーグやジェンスン・ファンら13名を任命しつつマスクとアルトマンを除外するという注目人事を発表。日本ではSakana AIが日本語特化チャットボット「Sakana Chat」を無料公開し、メルカリがAI生成画像への注意喚起を行うなど、AIの社会実装に伴う課題と可能性が同時に浮上しています。本記事では、この2日間の世界・日本のAIニュース20選をテーマ別に整理し、それぞれの背景とインパクトを独自の視点で解説します。
2026年3月25〜26日のAI業界ニュース概要
この2日間のAIニュースを俯瞰すると、「AIインフラの再編」と「製品ポートフォリオの選択と集中」という2つの大きな潮流が浮かび上がります。ハードウェア面ではArmが自社設計チップ市場に本格参入し、NVIDIAのGPU一強体制に風穴を開ける動きを見せています。GoogleもGemini 3.1 Flash-Liteで「より速く・より安く」というAIモデルの民主化を加速させました。
ソフトウェア・サービス面では、OpenAIがSoraとDeep Research(レガシー版)を相次いで終了し、エンタープライズAIとIPO準備に経営資源を集中させる姿勢を鮮明にしています。年間収益250億ドルを達成しながらも、コーディング支援市場ではAnthropicのClaude Codeに73%のシェアを奪われている現状を打破すべく、次世代モデル「Spud」の事前学習を完了させるなど反攻の準備を進めています。
政策・規制面では、トランプ大統領のPCAST任命人事がAIガバナンスの方向性を示唆し、連邦判事がペンタゴンのAnthropicへの制裁を「批判への罰に見える」と踏み込んだ批判を展開するなど、AI企業と政府の関係が法的・政治的に新たな段階に入ったことが明確になりました。日本では、Sakana AIの「Sakana Chat」が国産ChatGPT代替として注目を集め、メルカリのAI画像問題がECプラットフォームにおけるAI規制の議論を加速させています。
Arm、35年ぶり自社設計AI専用チップ「AGI CPU」を発表——Metaが初顧客、株価16%急騰
2026年3月25日、英半導体設計大手のArmが35年の歴史で初めて自社設計したチップ「AGI CPU」を発表しました。これまでArmはチップの設計図(IPライセンス)を他社に提供するビジネスモデルに徹してきましたが、AI時代の到来を受けて自らシリコンを製造する歴史的な転換を決断しています。この発表を受け、Arm株価は翌日に16%急騰し、市場からの期待の高さを如実に示しました。
AGI CPUのターゲットはデータセンター向けAI推論処理です。AI推論とは、学習済みモデルを使って実際にユーザーのクエリに応答する処理のことで、ChatGPTやClaudeの応答生成もこれに該当します。現在、この領域はNVIDIAのGPUが圧倒的なシェアを持っていますが、Armは専用設計のCPUアーキテクチャで推論コストを大幅に削減できると主張しています。Metaを初顧客として獲得し、OpenAI、Cerebras、Cloudflare、SAPなど大手テック企業も参画を表明しており、2031年までに15億ドルの収益を見込む大型プロジェクトです。
136コア・3nmプロセスの技術的特徴とエコシステム
AGI CPUは136コア・3nmプロセスという先端スペックを誇ります。3nmプロセスはTSMCの最新製造技術であり、トランジスタ密度の向上と消費電力の低減を両立しています。136個のCPUコアを搭載することで、大規模言語モデル(LLM)の推論処理を並列化し、GPUに頼らない高効率なAI推論を実現する設計思想です。
特筆すべきは、Armが単なるチップ販売ではなくエコシステムの構築を狙っている点です。Armアーキテクチャはスマートフォンの99%以上で採用されており、開発者エコシステムの規模はx86(Intel/AMD)を凌駕します。このソフトウェアエコシステムをデータセンター向けAI推論にも展開することで、GPU依存からの脱却を目指す企業にとって魅力的な選択肢となります。OpenAI、Cerebras、Cloudflare、SAPといった多様な顧客が初期パートナーに名を連ねていることは、AI推論チップ市場がNVIDIA一強から多極化に向かう兆候と読み取れます。
ソフトバンク大株主のArm——日本のAIインフラ戦略への影響
Armの自社チップ参入は、日本のAIインフラ戦略にも大きな影響を与える可能性があります。ソフトバンクグループがArmの大株主であることから、日本企業はArmのAI推論チップを他国よりも有利な条件で調達できる可能性があります。ソフトバンクが推進する国内AI基盤整備プロジェクトにおいて、AGI CPUが中核的な役割を果たすシナリオは十分に考えられます。
また、NVIDIAのGPUに依存する現在のAIインフラ構成は、供給制約や価格高騰のリスクを常に抱えています。AGI CPUという代替選択肢の登場は、日本企業のAIインフラ調達戦略に「マルチベンダー化」という新たな選択肢を提供します。特にAI推論コストの削減は、AIサービスの収益性に直結するため、日本のAI関連企業にとって注視すべき動向です。
OpenAI、AI動画生成アプリ「Sora」を終了——ディズニーとの10億ドル契約も破談
OpenAIがわずか6ヶ月前にリリースしたAI動画生成アプリ「Sora」のサービス終了を発表しました。Soraは2025年後半に華々しくローンチされ、AIによる動画生成の新時代を切り拓くと期待されていましたが、複数の深刻な問題に直面し短命に終わりました。同時に、ディズニーとの1億ドル超の3年間ライセンス契約も破談となり、OpenAIのコンテンツ戦略に大きな打撃を与えています。
このSora終了は単なる製品の撤退ではなく、OpenAIの経営戦略の根本的な転換を象徴する動きです。消費者向けの派手なプロダクトから、エンタープライズ向けAIへの集中、そして2026年後半に予定されるIPOに向けたポートフォリオ整理の一環として位置づけられています。ChatGPTの買い物機能も廃止されており、OpenAIは「何でもできるAI」から「ビジネスに不可欠なAI」へとブランドの再定義を図っています。
Sora終了の3つの理由——コスト・ディープフェイク・ダウンロード急落
Sora終了の背景には、3つの相互に関連する問題がありました。第一に、GPU処理コストの膨大さです。テキスト生成と比較して、動画生成に必要な計算リソースは桁違いに大きく、1本の動画生成にかかるGPUコストがサブスクリプション収入を上回るケースも発生していたとみられます。AI動画生成は技術的には魅力的ですが、ビジネスモデルとしての持続可能性が証明できなかったのです。
第二に、ディープフェイク懸念の深刻化です。Soraで生成された映像が政治的プロパガンダや詐欺に利用される事例が報告され、規制当局からの圧力が強まっていました。第三に、ダウンロード数の急落です。ローンチ直後は330万ダウンロードを記録しましたが、直近では110万まで急減しており、消費者の関心が急速に薄れたことが数字に表れています。これら3つの要因が重なり、OpenAIはSoraの事業継続を断念したとみられます。
ソース:NPR
日本のクリエイティブ業界が学ぶべき「AI動画生成の教訓」
Soraの終了は日本メディアでも大きく報道され、国内のクリエイティブ業界にも衝撃を与えました。日本の映像制作業界では、AI動画生成ツールを制作ワークフローに組み込む動きが広がり始めていただけに、「AI動画生成サービスが突然終了するリスク」を改めて認識させる出来事となりました。特にディズニーとの大型契約破談は、AIコンテンツ生成に関する権利処理の複雑さを浮き彫りにしています。
日本のクリエイティブ業界にとっての教訓は明確です。AI動画生成ツールは「使い時」と同時に「終わり時」も想定した上で導入すべきということです。特定のAIサービスに深く依存した制作ワークフローは、サービス終了時に大きな混乱を招きます。複数のAI動画生成ツールを併用する「マルチベンダー戦略」と、AI依存度を段階的にコントロールするリスク管理が、今後のクリエイティブ業界には不可欠となるでしょう。
ソース:Japan Times
Claude Code「オートモード」発表——承認不要でAIが安全チェックしながら自律作業
AnthropicがClaude Codeに「オートモード」を追加しました。Claude Codeはコマンドライン上で動作するAIコーディングエージェントで、コード生成・ファイル編集・テスト実行・Git操作などを自律的に行います。従来はファイル書き込みやBashコマンドの実行のたびに人間の承認が必要でしたが、新しいオートモードではAI自体が各アクションの安全性をチェックし、問題がなければ自動的に実行します。
このオートモードは、Claude Codeのユーザーが長年感じていた「承認疲れ」を解消する画期的な機能です。大規模なリファクタリングや複数ファイルにまたがるコード変更を行う際、数十回〜数百回の承認操作が必要だった従来のワークフローが、オートモードではAIに作業を委任して結果を確認するだけというシンプルなプロセスに変わります。Teamプランで先行公開され、今後Enterpriseプランへの拡張も予定されています。
安全性チェックの仕組みと自動ブロック機能
オートモードの核心は「自律性と安全性の両立」にあります。AIが各アクションを実行する前に、そのアクションがどの程度のリスクを持つかを自動評価します。リスクレベルが低い操作(コードの読み取り、テストの実行、ローカルファイルの編集など)は自動実行し、リスクの高い操作は実行前にユーザーの確認を求めるか、自動的にブロックします。
具体的には、大量のファイル削除、データ流出リスクのある外部通信、悪意のある操作パターンの検知などが自動ブロックの対象となります。Anthropicは「AIにより多くの制御を与えつつ、リーシュ(手綱)は維持する」というアプローチを取っており、完全な自律ではなく「安全な範囲内での自律」を実現しています。この設計思想は、AI開発ツールにおける安全性と生産性のトレードオフに対する、現時点での最適なバランスポイントを示していると言えるでしょう。
ソース:TechCrunch
日本の開発者コミュニティが注目する「承認疲れ」の解消
Claude Codeオートモードは日本の開発者コミュニティでも大きな注目を集めています。Claude Codeはコーディング支援市場で73%のシェアを獲得しており、日本でも多くのエンジニアが日常的に利用しています。従来の「1操作ごとに承認」というワークフローは安全性の面では優れていましたが、実際の開発現場では「承認ボタンを押す作業」が生産性のボトルネックになっていたのが実情です。
特に日本の開発現場では、コードレビューや品質管理の文化が根づいているため、AIが自律的にコードを書くことへの心理的ハードルが比較的高い傾向にあります。オートモードの「安全チェック付き自律実行」というアプローチは、「AIに任せたいがリスクは取りたくない」という日本の開発者の要望に応える設計となっています。Teamプラン向けの先行提供ということで、まずは企業の開発チームから導入が進むとみられ、日本のソフトウェア開発の生産性向上に寄与する可能性があります。
AIソリューションの導入をご検討ですか?
株式会社Awakでは、お客様の課題に合わせたAI導入支援・システム開発を行っています。まずはお気軽にご相談ください。
トランプ大統領、AI科学技術諮問委員会にザッカーバーグ・ファンらを任命——マスクとアルトマンは除外
トランプ大統領が大統領科学技術諮問委員会(PCAST)に13名を任命しました。Meta CEO マーク・ザッカーバーグ、NVIDIA CEO ジェンスン・ファン、Oracle会長ラリー・エリソン、Google共同創業者セルゲイ・ブリン、AMD CEO リサ・スーという、テック業界の最高幹部クラスが名を連ねています。PCASTはAIガバナンスと米国のAI覇権維持に関する政策提言を行う重要な諮問機関であり、その構成メンバーはAI政策の方向性を大きく左右します。
この人事で最も注目されているのは、イーロン・マスクとサム・アルトマンが名簿から除外された点です。マスクはxAIでGrok、アルトマンはOpenAIでChatGPTを運営するAI業界の最大プレーヤーであり、両者の除外はAI政策の方向性に関する明確なシグナルを発しています。トランプ政権がAIガバナンスの主導権をどの企業群に委ねるかという、権力構造の再編が進んでいることを示す重要な人事です。
任命された13名の顔ぶれと除外の政治的背景
任命メンバーにはAIチップ(NVIDIA、AMD)、AIプラットフォーム(Meta、Google)、クラウドインフラ(Oracle)というAIバリューチェーンの主要レイヤーが網羅されています。この構成は、AI政策がモデル開発だけでなく、半導体からクラウドまでのスタック全体を視野に入れていることを示唆しています。
マスクとアルトマンの除外については複数の解釈が可能です。マスクについては、政権内でのDOGE(政府効率化部門)関連の政治的緊張が背景にあるとの見方が有力です。アルトマンについては、OpenAIが営利転換を進める中でのIPO準備と、政権との距離感の取り方が影響している可能性があります。いずれにせよ、PCAST委員会メンバーの企業は政策的に有利なポジションを得る一方、除外された企業は規制面でのリスクを抱えることになります。
ソース:Fortune
米国AI政策の方向性が日本・G7のAI戦略に与える影響
PCAST委員会の構成は、米国のAI政策の方向性を示す重要な指標であり、日本を含むG7各国のAI戦略にも波及効果をもたらします。ザッカーバーグやファンらが政策提言に関与することで、AIの規制よりもイノベーション促進を優先する政策方針が強まる可能性があります。これはEUのAI規制強化路線とは対照的であり、日本はその中間でバランスを取る立場に立つことになるでしょう。
日本のAI戦略にとって実務的に重要なのは、PCASTメンバーの企業(Meta、NVIDIA、Oracle、Google、AMD)が日本市場でどのようなビジネス展開を行うかです。これらの企業は日本のAIインフラ整備やAI人材育成において重要なパートナーであり、米国政策の恩恵を受けた企業が日本市場でより積極的な展開を行う可能性があります。日本政府が2026年3月に閣議決定した「人工知能基本計画」の実行においても、これらの企業との連携は不可欠です。
連邦判事「ペンタゴンのAnthropicへの制裁は批判への罰に見える」——AI規制の転換点
サンフランシスコ連邦地裁のリタ・リン判事が追加証拠に基づく審議で、「これはAnthropicがメディアで政府の調達方針を批判したことへの罰に見える」と踏み込んだ批判を展開しました。ペンタゴンがAnthropicを「サプライチェーンリスク」として指定した件について、リン判事は国家安全保障上の正当性に疑問を呈し、政治的動機による制裁の可能性を指摘しています。
この裁判はAI企業と政府機関の間の規制ルール設定に向けた世界初の本格的法廷闘争として注目されています。AI企業が自律型兵器への使用禁止や市民監視への使用制限といった倫理方針を掲げたことが政府調達からの排除理由となりうるかという根本的な問いが問われているのです。判決は週内に出る見通しで、その内容はAI企業が政府との関係において倫理方針をどう位置づけるべきかの先例となり、日本を含む各国のAI利用ガイドライン策定にも参考事例として引用されることが予想されます。
ソース:Al Jazeera
OpenAI次世代モデル「Spud」事前学習完了——アルトマンCEOは安全監督を離脱
OpenAIの次世代主力AIモデル(コードネーム「Spud」)の事前学習が完了したとアルトマンCEOが社員に報告しました。アルトマンCEOは「経済を大幅に加速させる」と発言しており、Spudが現行モデルから大幅な性能向上を果たしていることを示唆しています。エンタープライズAI市場でAnthropicのClaude Codeに73%対27%でシェアを逆転されているOpenAIにとって、Spudの早期展開は反攻の核となります。
しかし同時に、アルトマンCEOが安全・セキュリティチームの直接監督を手放したことも明らかになりました。データセンター建設、資金調達、IPO準備に注力するための判断とされていますが、次世代モデルの開発完了と安全監督からの離脱が同時に起きたことは、AI安全性の議論において懸念材料となりえます。OpenAIからは2023年にもAI安全チームの責任者が離脱する事態が起きており、経営トップの安全監督への関与度が問われる状況が繰り返されています。日本のAI活用企業は、新モデルの登場に伴う開発環境の再評価を迫られる可能性があります。
ソース:Tom's Guide
OpenAI年間収益250億ドル超達成——エンタープライズ転換とIPO準備が加速
OpenAIの年間収益が250億ドル(約3.7兆円)を超えたことが明らかになりました。この数字は、AI産業の市場規模が急速に拡大していることを示す象徴的な指標です。2026年後半のIPOに向けた初期的な準備が進んでおり、OpenAIはSora終了、ChatGPT買い物機能廃止など消費者向けサービスを整理し、エンタープライズAIに集中する戦略へ転換しています。
ただし、OpenAIが直面している課題も無視できません。エンタープライズ向けコーディング支援市場ではAnthropicのClaude Codeが73%のシェアを獲得しており、かつてOpenAIが圧倒していた開発者市場で完全に逆転されています。この状況を打破するために、次世代モデル「Spud」の早期投入とポートフォリオ整理を同時に進めているわけですが、IPO前に競合との差を縮められるかが最大の焦点です。250億ドルという売上は巨大ですが、GPUコストや人件費を考慮した収益性については依然として不透明な部分が多く、IPO時の企業価値評価に影響を与える要素として注目されています。
ソース:Axios
OpenAI「Deep Research」レガシー版を廃止——ポートフォリオ整理が急ピッチ
OpenAIが旧型の「Deep Research」モード(レガシー版)を3月26日付で廃止しました。現行のDeep Research体験は継続し、過去の会話も引き続きアクセス可能ですが、レガシー版の機能は利用できなくなります。Soraの終了に続くこの動きは、OpenAIが複雑化した製品群を急ピッチで整理していることを示しています。
IPOを控えた企業にとって、製品ポートフォリオのシンプル化は投資家への訴求力を高める上で重要です。複数の類似機能が並立する状態は、技術的負債の増大とユーザー体験の混乱を招きます。OpenAIは「何でもできるAIプラットフォーム」から「ビジネスに不可欠なコアAI機能」に絞り込む方向で製品戦略を再構築しており、Sora・買い物機能・Deep Researchレガシー版の廃止はその一環です。エンタープライズ向けChatGPTと次世代モデルSpudを軸とした、よりフォーカスされた製品ラインナップへの移行が急速に進んでいます。
ソース:The Neuron
メラニア・トランプ夫人、ホワイトハウスにAIロボット「Figure 03」を招き教育活用を主張
メラニア・トランプ夫人がホワイトハウスで開催した教育サミットで、人型ロボット「Figure 03」を登場させ、AIロボットが子どもの批判的思考力を育てることができると主張しました。Figure 03はロボティクス企業Figure AIが開発する最新の人型ロボットで、サミットでは11言語で来賓に挨拶するデモンストレーションが行われました。
メラニア夫人は「AIロボットは決して苛立たない教師になれる」と述べ、AIの教育活用に向けたホワイトハウスの積極姿勢を示しました。これは単なるテクノロジーのショーケースではなく、米国政府がAI教育を国策として推進する意志を表明するものです。AI教師が人間の教師を補完する形での教育システム改革は、教員不足や教育格差の解消に向けた一つのアプローチとして注目されています。一方で、「AIロボットに子どもの教育を委ねることへの倫理的懸念」や「人間の教師の役割の変化」に関する議論も巻き起こっており、AIの教育活用は技術的な可能性だけでなく社会的な合意形成が不可欠な分野です。
ソース:TechCrunch
Google「Gemini 3.1 Flash-Lite」公開——前世代比2.5倍速・入力1Mトークン$0.25
GoogleがGemini API、Vertex AI、Geminiアプリで「Gemini 3.1 Flash-Lite」を公開しました。従来版より2.5倍高速で出力速度は45%向上、価格は100万入力トークンあたり$0.25と大幅なコストダウンを実現しています。この価格は、OpenAIのGPT-4シリーズやAnthropicのClaude 4.6 Sonnetと比較しても圧倒的な低コストであり、AIモデルの「コモディティ化」が加速していることを示しています。
Flash-Liteの登場は、AI業界全体のトレンドを象徴しています。かつてはAIモデルの性能(ベンチマークスコア)が競争の焦点でしたが、現在は「同等の性能をいかに安く・速く提供できるか」が差別化のポイントに移行しています。GoogleのFlash-Liteは、エンタープライズ向けの大量処理や、リアルタイム応答が求められるアプリケーションにおいて、コスト効率で大きなアドバンテージを持ちます。Googleが「強力なAIをより安価・迅速に活用できる」方向に振り切ったことで、AI市場の競争軸が性能からコスト効率へとシフトしていることが一層明確になりました。
低コストAIで中小企業のAI活用がより身近に
Gemini 3.1 Flash-Liteの低価格化は、日本の中小企業や個人開発者にとって特に大きな意味を持ちます。これまでAI API利用のコストが障壁となってAI活用に踏み切れなかった中小企業にとって、100万トークンあたり$0.25(約37円)という価格は、月額数千円レベルでAI機能を自社サービスに組み込めることを意味します。
日本ではDX推進が国策として進められていますが、中小企業のAI導入率は大企業と比較して大幅に低い状況が続いています。コスト面でAI活用に躊躇していた層にとって、Flash-Liteクラスの低コストモデルの登場はAI導入の「最後の一押し」になる可能性があります。チャットボット、文書要約、データ分析、カスタマーサポートなど、中小企業でも活用しやすいAIユースケースが、現実的なコストで実現可能になりつつあります。AIの社会実装がさらに加速する契機として、Flash-Liteの登場は注目に値します。
日本のAI最前線——Sakana Chat・メルカリAI画像問題・SWE-CIベンチマーク
日本国内のAIニュースでは、AI製品の市場投入とAI利用に伴う社会的課題が同時に浮上した2日間でした。Sakana AIが日本語特化のチャットボットで国内ChatGPT市場に挑戦する一方、メルカリはAI生成画像の悪用リスクに注意喚起を行い、AIの「光と影」が鮮明に表れています。また、AIコーディングの実用的な評価手法に関する新たな研究提案も注目を集めました。
Sakana AI、日本特化チャットボット「Sakana Chat」を無料公開——独自Namazuモデルで断り率ゼロ
東京拠点のAIスタートアップSakana AI(企業価値約2,650億円)が、日本語・日本文化に最適化したチャットボット「Sakana Chat」を無料公開しました。Sakana AIはGoogle DeepMindの元研究者らが設立した注目のスタートアップで、独自開発の「Namazuモデル」を搭載しています。NamazuモデルはDeepSeek、Llamaなどの有力オープンソースモデルをベースに大規模な後訓練を実施し、日本語の流暢さと文化的コンテキストの理解度を大幅に向上させています。
Sakana Chatの最大の特徴は、元々72%に達していた回答拒否率をほぼゼロに低減したことです。既存のLLMは日本語での質問に対して過度に回答を拒否する傾向があり、これは日本のユーザー体験を著しく損なう要因でした。Sakana AIはこの課題に正面から取り組み、安全性を維持しながらも実用的な回答を提供するバランスを実現しています。ウェブ検索との統合機能も搭載しており、リアルタイムの情報を組み込んだ回答が可能です。
Sakana Chatの登場は、日本のAIチャットボット市場にChatGPT以外の選択肢が本格的に現れたことを意味します。日本語に最適化されたモデルが無料で利用できることは、企業・個人を問わずAI活用の裾野を広げる効果が期待されます。Sakana AIは今後、企業向けAPIの提供やカスタマイズサービスの展開も視野に入れているとみられ、日本発のAI企業としての成長軌道が注目されています。
ソース:日経アジア
メルカリ、出品ページの生成AI画像に注意喚起——EC業界のAI画像ガイドライン整備が急務
フリマアプリ大手のメルカリが、商品出品ページへの生成AI画像使用に関する注意喚起を実施しました。実物と異なるAI生成画像を使用することで購入者に誤解を与え、取引トラブルに発展するリスクがあると警告しています。生成AIの画像生成能力が向上した結果、実写と区別がつきにくいAI生成画像が出品ページに使用されるケースが増加していることが背景にあります。
この問題はメルカリに限らず、ECプラットフォーム全体が直面する課題です。AI生成画像は商品を「理想化」して表現することが容易であり、実物との乖離が購入者の信頼を損ない、返品・クレームの増加につながります。メルカリの注意喚起はECプラットフォームにおけるAI生成コンテンツのガイドライン整備が急務であることを示す事例として、業界全体に波及効果をもたらすでしょう。今後、AI生成画像の検出技術や、AI画像であることを明示する表示義務の導入など、プラットフォーム側のルール設計が議論の焦点となりそうです。
ソース:ITmedia AI+
AIコード長期保守能力を測る新評価テスト「SWE-CI」——中国チームが提案
中国の研究チームが、AIの「長期的なコード保守能力」を評価するための新たなベンチマーク「SWE-CI」を提案しました。既存のコーディングベンチマーク(SWE-benchなど)が短期的なコード生成能力しか測定できていないという課題を指摘し、継続的インテグレーション(CI)環境でのバグ修正や保守作業における実用的なAI能力を測定することを目指しています。
SWE-CIの提案は、AIコーディングツールの評価方法に一石を投じるものです。現実のソフトウェア開発では、コードを「書く」よりも「保守する」時間のほうが圧倒的に長く、AIコーディングツールの真の実力はコード保守能力によって測られるべきという問題提起は本質的です。Claude Code、GitHub Copilot、Cursorなどのツールが長期的なコード保守タスクでどれだけ実用的かを客観的に評価する手段として、SWE-CIは今後のAI開発ツール選定の重要な指標になる可能性があります。日本のソフトウェア開発企業にとっても、AIコーディングツールの導入判断に役立つ実践的なベンチマークとして注目に値します。
ソース:ITmedia AI+
まとめ
2026年3月25〜26日のAIニュースを振り返ると、「AIインフラの多極化」「製品ポートフォリオの選択と集中」「AI規制の法的・政治的成熟」という3つの潮流が鮮明になりました。ArmのAGI CPU発表はNVIDIA一強のAI推論チップ市場に風穴を開け、GoogleのGemini Flash-LiteはAIモデルのコモディティ化を加速させています。OpenAIはSora・Deep Researchレガシー版を相次いで廃止しIPO準備を急ぐ一方、AnthropicはClaude Codeオートモードで開発者市場のシェアをさらに固めています。
政策・規制面では、トランプ大統領のPCAST任命人事がAIガバナンスの権力構造を再編し、連邦判事がペンタゴン対Anthropic訴訟で政府の制裁措置に踏み込んだ批判を展開するなど、AI企業と政府の関係が法的に整理される歴史的な局面を迎えています。メラニア夫人がAIロボットの教育活用を推進する姿勢も、AIの社会実装が政治的なアジェンダに組み込まれていることを象徴しています。
日本では、Sakana AIの「Sakana Chat」がChatGPTに代わる国産チャットボットとして期待を集め、メルカリのAI画像問題がEC業界全体のAI規制議論を加速させています。今後の注目ポイントは、Pentagon対Anthropic訴訟の判決、OpenAI次世代モデルSpudのリリース時期、Arm AGI CPUの量産スケジュール、そしてSakana AIのエンタープライズ展開です。AI業界は「何ができるか」から「何に集中するか」へと、競争の軸が急速に移行しています。
