NEC、130 億パラメーターで世界トップ クラスの日本語性能を有する軽量な LLM を開発(2023 年 7 月 6 日):プレス リリース|NEC

【NEC】世界トップ クラスの日本語性能を持つ大規模言語モデル(Large Language Model)の開発を発表

特集(クラウド サービス)
0 0
Read Time:1 Minute, 50 Second
NEC、130 億パラメーターで世界トップ クラスの日本語性能を有する軽量な LLM を開発(2023 年 7 月 6 日):プレス リリース|NEC
NEC、130 億パラメーターで世界トップ クラスの日本語性能を有する軽量な LLM を開発(2023 年 7 月 6 日):プレス リリース|NEC

NEC(日本電気株式会社)が、Generative AI(生成 AI)における日本語大規模言語モデル(Large Language Model)を開発したことを発表しています。

本 LLM(Large Language Model)は独自に収集、加工した多言語データを利用し、開発したファウンデーション モデルとなり、独自の工夫によって高い性能を実現しつつもパラメーター数を 130 億に抑えることで、消費電力を抑制するだけでなく、軽量、高速になっており、クラウドだけでなく、オンプレミス環境での運用も行えます。

なお、性能面においては、日本語の知識量や文章読解力を計測する日本語の一般的なベンチマークで、世界トップ クラスの日本語能力を実現しているとのことです。

また、同社では、本 LLM(Large Language Model)の社内業務における活用も実施し始めており、文書作成のほか、社内システム開発におけるソース コードの作成業務など、様々な作業での業務効率化に導入しています。

目次






Generative AI(生成 AI)における日本語大規模言語モデル(Large Language Model)の開発背景

  • 昨今、”ChatGPT” を始めとした Generative AI(生成 AI)が世界的に注目を集めており、様々な業界での急速な活用が進んでいます。
  • しかしながら、既存の “LLM(Large Language Model)” のほとんどは英語を中心に学習されていることから、高い日本語性能を有しつつも、各業種の業務で活用するためのカスタマイズに対応した LLM(Large Language Model)は、ほぼない状況となっています。
  • 今回、NEC(日本電気株式会社)では自社での “LLM(Large Language Model)” を開発することで、よりビジネスでの活用を加速させ、企業の生産性向上にも寄与するとのことです。

NEC(日本電気株式会社)の “LLM(Large Language Model)” のポイント

日本語言語理解ベンチマーク JGLUE による性能評価結果(NEC 調べ)
日本語言語理解ベンチマーク JGLUE による性能評価結果(NEC 調べ)
高い日本語能力
  • “LLM(Large Language Model)” を実際の業務で利用するためには、日本語に関する知識量や文章読解力の点で高い性能が求められます。
  • 本 “LLM(Large Language Model)” を自然言語処理分野で標準的なベンチマークである日本語言語理解ベンチマーク “JGULUE(Japanese General Language Understanding Evaluation)” を利用して評価したところ、現時点の知識量に相当する質問応答で 81.1 %、推論能力に相当する文章読解においても 84.3 % と世界トップ レベルの性能を達成しており、様々な業種における業務で十分な機能を発揮することが期待されます。
軽量
  • 本 “LLM(Large Language Model)” では高い性能を有しながらも NEC(日本電気株式会社)独自の技術によって、130 億のパラメーターとモデル サイズがコンパクトに抑えられています。
  • これにより、高い性能を有する従来の “LLM(Large Language Model)” が多数の GPU を必要とするのに対して、本 “LLM(Large Language Model)” では GPU 1 枚を搭載した標準的なサーバーによる動作が行えるようになっています。
  • また、”LLM(Large Language Model)” を組み込んだ業務用アプリケーションはレスポンス良く動作しつつも、業務運用時の電力消費やサーバー コストを抑えることも可能になっています。
  • さらに、ユーザーの業務に特化させた “LLM(Large Language Model)” を短期間で容易に構築できることに加えて、オンプレミス環境での動作も可能なため、秘匿性の高い業務においても安心して利用できます。
  • 各 “LLM(Large Language Model)” の特徴の 1 つとして、パラメーター サイズの大小が用いられることが多々ありますが、パラメーターのサイズを増やした場合、推論速度の低下やモデル運用に必要な GPU の枚数増加、消費電力の増加にもつながるため、同一性能であればパラメーター数は少ないことが望まれます。
  • 本 “LLM(Large Language Model)” ではパラメーター サイズのほかにも、学習に利用された高品質なデータ量や学習時間に左右されることに着目して開発されており、パラメーター サイズを GPU 1 枚で動作する範囲に抑えた上で、多量のデータと膨大な計算時間をかけることで高い性能を実現しています。
  • また、NEC(日本電気株式会社)では、2023 年 3 月より、国内企業で最大の AI 研究用スーパー コンピューターの全面稼働を開始しています。
  • 本 “LLM(Large Language Model)” では、これを活用することで約 1 ヶ月という短期間での高性能な “LLM(Large Language Model)” の構築を実現しています。
  • なお、今後はファウンデーション モデルをもとにユーザーのクローズド データを用いた個社向け “LLM(Large Language Model)” の開発を推進していくほか、ファウンデーション モデル自体の性能改良にも取り組み、これらの技術を “NEC Generative AI Hub” を通じて早期実用化を行う予定とのことです。

NEC(日本電気株式会社)関連記事一覧

NEC(日本電気株式会社)関連記事一覧

関連リンク

Happy
Happy
0 %
Sad
Sad
0 %
Excited
Excited
0 %
Sleepy
Sleepy
0 %
Angry
Angry
0 %
Surprise
Surprise
0 %

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください