膨大な文章データでディープラーニングによる事前学習を行った言語モデル。あらかじめ人が与えた言語規則に基づく従来の自然言語処理と異なり、まるで人間が書いたかのような自然な文章の生成が行える。オープンAI社のGPT、グーグル社のBERT (バート) やPaLM2 (パームツー) 、メタ社のLLaMa (ラマ) などがある。対話型AIなどの生成AIで利用される。LLM(large language model)。
出典:gooニュース
NTTが日本語に特化した大規模言語モデル「tsuzumi」を開発した理由
生成AIの認知度が一気に上がったきっかけは、大規模言語モデル「ChatGPT」の登場だろう。大規模言語モデル(LLM)とは、大量のテキストデータを処理し、自然言語(人間が扱う日本語や英語などの言語)を理解・生成するもののこと。 NTT人間情報研究所は、2023年11月に独自のLLM「tsuzumi」の開発を発表し、2024年3月には商用サービスとしての提供を開始した。
スパコン富岳で大規模言語モデル 高い日本語能力、一般に公開
東京工業大や理化学研究所、富士通などのチームは10日、スーパーコンピューター「富岳」を活用し、日本語能力に優れた生成AIの基盤技術「大規模言語モデル」を独自に開発したと発表した。企業や大学がダウンロードして使用できるほか、一般市民も富士通のホームページから試すことができる。 大規模言語モデルは欧米や中国だけでなく、日本でも大学や企業が開発を進めている。
もっと調べる