glm-5 anchor left anchor right

Feb 12 2026

中国Zhipu AI、GPT-5に挑む745億パラメータ「GLM-5」を発表

anchor left anchor right

📖 この記事で分かること

  • 中国Zhipu AIが2026年2月11日に発表したGLM-5の概要と性能
  • 前世代から2倍に拡大した745億パラメータの技術的特徴
  • Huaweiチップで実現した米国非依存のAIインフラの意義
  • オープンソース戦略と低コストAPIがもたらす開発者への影響

💡 知っておきたい用語

  • Mixture of Experts(MoE)【ミクスチャー・オブ・エキスパーツ】: 料理で例えるなら「専門シェフのチーム制」のようなもの。全員が常に働くのではなく、料理の種類に応じて適切な専門家だけが担当することで、効率よく高品質な結果を出す仕組みです。AIモデルでは、総パラメータは巨大でも、実際に動くのは一部だけなので、計算コストを抑えながら高性能を実現できます。

最終更新日: 2026年2月12日

GLM-5の全貌:中国発の次世代AIモデルが示す新展開

中国のAIスタートアップZhipu AI(智谱AI)が2026年2月11日、新世代大規模言語モデル「GLM-5」を正式に発表しました。GLM-5は約745億パラメータのMixture of Experts(MoE)アーキテクチャを採用し、推論時には約44億パラメータがアクティブになる設計です。前世代のGLM-4.5(355億パラメータ)から規模を約2倍に拡大し、エージェント機能、マルチステップ推論、コーディング能力を大幅に強化しています。

最も注目すべき点は、GLM-5がHuawei Ascendチップで完全にトレーニングされたことです。米国製の半導体に依存せず、中国国内のハードウェアとMindSporeフレームワークのみで大規模モデルを実現したことは、技術的マイルストーンとして評価されています。Zhipu AIは2019年に清華大学からスピンオフした企業で、2026年1月8日には香港証券取引所に上場し、約43.5億香港ドルを調達しました。この資金がGLM-5の開発を加速させたとみられます。

GLM-5はMITライセンスでのオープンソース公開が予定されており、開発者は商用利用やファインチューニングを自由に行えるようになります。APIも提供される見込みで、前世代のGLM-4.xシリーズが示したコスト優位性(約0.11ドル/100万トークン)を維持または改善する可能性があります。これはOpenAIのGPT-5(1.25ドル/100万入力トークン)の約10分の1に相当し、フロンティアレベルのAI機能を低コストで利用できる選択肢として注目されています。

技術的特徴:MoEとDSAが実現する効率性

GLM-5の中核技術は、Mixture of Experts(MoE)アーキテクチャとDeepSeek Sparse Attention(DSA)の組み合わせです。MoEは、巨大なパラメータプールの中から、各タスクに必要な部分だけを選択的にアクティブ化する仕組みです。GLM-5では総パラメータ数745億のうち、推論時には約44億パラメータのみが動作します。これにより、フルサイズの密なモデルと比較して、計算コストとレイテンシを大幅に削減しながら、高い性能を維持しています。

DSAは、DeepSeekが開発したスパースアテンション機構で、長いコンテキストを効率的に処理するために設計されました。従来の密なアテンションでは、入力長が増えるほど計算量が二次関数的に増加しましたが、DSAはこの問題を緩和します。GLM-5は200,000トークン以上のコンテキスト長をサポートする見込みで、研究論文、大規模コードベース、ビデオ転写など、広範なドキュメントを一度に処理できます。

WaveSpeedAIのレポートによると、GLM-5の初期トークン遅延は短いプロンプトで1秒未満、複雑なマルチパート指示でも1〜2秒程度です。持続的なスループットは30〜60トークン/秒の範囲で安定しており、MoEモデルにありがちな推論中の不安定性は最小限に抑えられています。この安定性は、エージェント機能や対話型アプリケーションで重要な要素です。

トレーニングにはHuawei AscendチップとMindSporeフレームワークが使用されました。これは、米国製の半導体(NVIDIAのGPUなど)に依存しない完全国産のAI計算スタックを実証するものです。中国は半導体輸出規制の影響を受けていますが、GLM-5の成功は、国内技術のみでフロンティアレベルのモデルを開発できることを示しています。この戦略的意義は、技術的性能と同等かそれ以上に重要視されています。

エージェント機能とコーディング能力の強化

GLM-5の主要な強化点は、エージェント機能です。エージェント機能とは、AIが自律的に計画を立て、ツールを使い、複数のステップを経て目標を達成する能力を指します。GLM-5はこの機能を組み込みで持ち、Webブラウジング、マルチステップワークフロー管理、外部ツール呼び出しを人間の介入を最小限に抑えながら実行できます。

前世代のGLM-4.5は、τ-BenchやBFCL v3といったツール使用ベンチマークで高いスコアを記録しており、GLM-5ではさらなる改善が期待されます。GLM-4.5はτ-Benchで90.6%の精度を達成し、Claude Sonnet 4(89.5%)やKimi K2(86.2%)を上回りました。GLM-5の具体的なベンチマーク結果はまだ公開されていませんが、アーキテクチャの拡大とDSAの導入により、より複雑なエージェントタスクに対応できると考えられます。

コーディング能力も大幅に向上しています。GLM-4.5は、SWE-bench Verified(ソフトウェアエンジニアリング問題)で64.2%の精度を記録し、LiveCodeBenchやAIME24(競技数学)でも高いスコアを達成しました。GLM-5では、コード生成、デバッグ、マルチ言語理解がさらに改善され、ソフトウェア開発ライフサイクル全体で強力なパートナーとなることを目指しています。

実務的な観点では、GLM-5はコスト効率とエージェント能力のバランスが取れた選択肢となりそうです。現在、多くの開発者は小型の密なモデルで簡単なタスクを処理し、高コストな大型モデルを難しいタスクに使い分けています。GLM-5は、この中間領域を低コストでカバーし、モデルの切り替えを減らせる可能性があります。

中国AI市場での競争激化と戦略的タイミング

GLM-5の発表は、中国AI市場での競争が激化している時期と重なります。2026年2月の旧正月前後、複数の中国AI企業が新モデルを相次いで発表しています。Alibabaは推論力を強化したQwen3.5を発表し、DeepSeekはトークン処理能力を10倍に拡大したV3シリーズのアップデートを予告しています。MiniMaxもM2.2モデルを近日公開予定です。

この「発表ラッシュ」は偶然ではありません。中国のAI企業は、迅速なイテレーション、オープンイノベーション、価格競争力のあるAPIを武器に、市場シェアを拡大しています。GLM-5の発表タイミングは、旧正月の休暇前にコミュニティの関心を集め、テストとフィードバックを促進する戦略的な選択と見られます。

Zhipu AIのオープンソース戦略も重要な差別化要素です。GLM-4.7はすでにHugging FaceでMITライセンスで公開されており、商用利用が可能です。GLM-5も同様のライセンスで公開される見込みで、開発者はモデルウェイトを自由にダウンロードし、ファインチューニングや独自展開を行えます。これは、クローズドソースのGPT-5やClaude 4との大きな違いです。

一方で、中国国外でのアクセス性については不確実性が残ります。地政学的な要因や規制により、GLM-5のAPI利用やモデルウェイトのダウンロードが制限される可能性があります。また、実際のベンチマーク結果が公開されるまで、GLM-5の性能を他のフロンティアモデルと直接比較することは困難です。GLM-4.5は12の標準ベンチマークで平均63.2のスコアを記録しましたが、GLM-5の詳細な評価は今後の発表を待つ必要があります。

開発者への影響:オープンソースと低コストAPIの意味

GLM-5が開発者コミュニティにもたらす影響は、主に3つの観点から評価できます。第一に、オープンソースによる民主化です。MITライセンスでの公開は、企業規模を問わず誰でもフロンティアレベルのAI機能を利用できることを意味します。スタートアップや個人開発者は、高額なAPIコストやベンダーロックインを避けながら、独自のAIアプリケーションを構築できます。

第二に、コスト効率です。GLM-4.xシリーズは、GPT-5の約10分の1のコストでAPIを提供しています。GLM-5がこの価格帯を維持する場合、予算が限られているプロジェクトにとって大きなメリットとなります。特に、大量のトークンを処理するバッチ作業やエージェント型アプリケーションでは、コスト削減の効果が顕著です。

第三に、エージェント機能とコーディング能力の向上により、実用的なAIツールの開発がより容易になります。GLM-5の自律的計画、ツール使用、複数ステップのワークフロー管理機能は、複雑なタスクを自動化するアプリケーションの基盤となります。コーディング支援ツール、ドキュメント生成、データ分析エージェントなど、幅広いユースケースが想定されます。

ただし、いくつかの留意点もあります。MoEアーキテクチャは、一部のタスクで推論の安定性に課題が残る可能性があります。GLM-5はWaveSpeedAIのレポートで安定性が確認されていますが、実際の運用では継続的な検証が必要です。また、長文処理では、非常に大きなドキュメントを一度に処理するよりも、適切にチャンク分割することで信頼性が向上する場合があります。

オープンソースモデルのファインチューニングには、ある程度の技術的知識と計算リソースが必要です。GLM-5のウェイトが公開されても、すべての開発者がすぐに独自モデルを作成できるわけではありません。しかし、APIを通じて利用する場合、技術的ハードルは大幅に下がります。Zhipu AIは、開発者向けのドキュメント、サンプルコード、クイックスタートガイドを提供する見込みで、導入障壁を最小限に抑える方針です。


よくある質問

Q: GLM-5はいつから利用できますか?

A: 2026年2月10日から15日の間に正式リリースが予定されており、API提供とオープンソースのウェイト公開が続く見込みです。具体的な日程はZhipu AIの公式発表をご確認ください。

Q: GLM-5のAPI価格はどのくらいですか?

A: 正式な価格はまだ発表されていませんが、前世代のGLM-4.xシリーズは約0.11ドル/100万トークンで提供されています。GLM-5もこのコスト優位性を維持または改善する可能性が高いと考えられます。

Q: GLM-5はGPT-5やClaude 4と比較してどうですか?

A: 詳細なベンチマーク結果は公開されていませんが、前世代のGLM-4.5は12の標準ベンチマークで平均63.2を記録し、コーディングや推論タスクでGPT-5に近い性能を示しました。GLM-5はさらなる改善が期待されますが、直接比較は今後の評価結果を待つ必要があります。


まとめ

GLM-5は、中国のZhipu AIがフロンティアレベルのAI開発において大きな一歩を踏み出したことを示すモデルです。745億パラメータのMoEアーキテクチャ、Huawei Ascendチップでの完全トレーニング、エージェント機能の強化、そしてオープンソース戦略は、いずれも開発者コミュニティとAI市場に大きな影響を与える要素です。

特に、米国製ハードウェアに依存しないAIインフラの実現は、地政学的な文脈でも重要な意味を持ちます。GLM-5の成功は、中国が独自の技術スタックでフロンティアモデルを開発できることを証明しました。同時に、MITライセンスでのオープンソース公開と低コストAPIは、世界中の開発者がフロンティアレベルのAI機能にアクセスできる機会を広げます。

今後の注目点は、実際のベンチマーク結果、APIとオープンソースウェイトの公開スケジュール、そしてグローバル市場でのアクセス性です。GLM-5が約束通りの性能とコスト効率を実現すれば、AI開発の選択肢は大きく広がります。開発者は、複数のモデルを比較検討し、プロジェクトの要件に最適なものを選ぶことがますます重要になるでしょう。


【用語解説】

  • Mixture of Experts(MoE)【ミクスチャー・オブ・エキスパーツ】: AIモデルの設計手法の一つで、複数の専門化されたサブモデル(エキスパート)を持ち、各タスクに応じて適切なエキスパートだけを選択的に使用する仕組みです。総パラメータ数は巨大でも、実際に動作するのは一部だけなので、計算コストを抑えながら高性能を維持できます。
  • DeepSeek Sparse Attention(DSA)【ディープシーク・スパース・アテンション】: DeepSeekが開発した効率的なアテンション機構で、長いコンテキストを処理する際の計算量を削減します。従来の密なアテンションでは、入力が長くなるほど計算量が急増しましたが、DSAはこの問題を緩和し、大規模ドキュメントの処理を高速化します。
  • エージェント機能【えーじぇんときのう】: AIが自律的に計画を立て、ツールを使い、複数のステップを経て目標を達成する能力のことです。単一の質問に答えるだけでなく、Webブラウジング、データ分析、コード実行などを組み合わせて複雑なタスクを完遂できます。

免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。


引用元:

anchor left anchor right
KOJI TANEMURA

15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。

技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。

また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。