SEISAKU DB トップ
SEISAKU DB
橋本慧悟 ·立憲民主党・無所属

衆議院内閣委員会(2025-04-11)での発言

第217回国会 ·第第13号号 ·767字
○橋本(慧)委員 まさに、御答弁をいただきまして、日本語のデータが少ないということだと思います。  生成AIでは、大量のデータを学習させてモデルの規模を巨大化するほどその予測精度も向上することから、大規模言語モデル、ラージランゲージモデル、LLMと呼ばれたり、この開発が、モデルの大規模化を目指して熾烈な競争が繰り広げられていると認識をしております。  この言語モデルというのは、人間が話したり書いたりする言葉や文章を基に単語の出現確率をモデル化する技術だと認識しています。  具体的には、大量のテキストデータから学習をして、ある単語の後に続く単語がどのくらいの確率で出現するのかを予測するものです。例えば、私の職業は、というような文章の後に続く単語として、教師ですとかエンジニアですとか保育士ですというような、それは確率として高いなという判断が働き、ここにある机とか黒色とかスーツとかという言葉は可能性としては低いと判断していく、それで言語をモデル化していくものだと思います。こうして言語モデルは、単語の出現確率を統計的に分析することで人間の言語を理解して予測ができるようになると思います。  それで、生成AIの基盤となる大規模言語モデルの開発では、やはりマイクロソフトやグーグルなど米国のビッグテック企業が先行している現状にありまして、我が国においても国産の大規模言語モデルの開発に向けた取組は進められていると思いますが、生成AIを日本語で問題なく使えるようにするためには、高品質の日本語のウェブテキストというのを学習データとしてしっかりと収集をして、この構築に利活用できるようにしておく必要があると思います。  学習データに用いられる日本語のウェブテキストとしては、具体的にどのようなものを想定されていますでしょうか。

橋本慧悟 の他の発言

2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 約五億円程度、一年間で給与が削減されるというお答えでありました。  一方で、松本大臣からも御答弁があったように、既にこれまで自主的に一割から三割を自主返納してい…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 済みません、実際の金額のところの見解をお聞きしているので、その辺りを端的にお答えいただけますでしょうか。…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 御答弁をいただきましたが、申合せでは分かりにくいというのは、その理由の説明には、私はちょっとまだ不十分かなと思っております。十分、広報でありますとか発信の仕方によ…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 御回答ありがとうございます。  是非とも、更に細分化した評価基準なども、やはり対外的にも、そして志す候補者、職員の方々にとっても大切だと思いますので、よろしくお…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 見せ方を少しでもよくするというようなこともとても大切なことだと思いますが、それにこだわり過ぎず、やはり実際の業務改善、本当に一人一人というか、置かれている職場環境…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 公務員の職務が複雑化、高度化する中、今、公平でありますとか高い視座、広い視野、そういったこともおっしゃられました。本当に必要なことだと思いますが、国家公務員の特性…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 御答弁をいただきました。  厳しい人材獲得競争というようなこともおっしゃられましたし、各報告にも目立っておりますが、民間にも人材確保で負けないように、今回でいう…
2025-12-10 · 衆議院内閣委員会
○橋本(慧)委員 立憲民主党・無所属、衆議院議員の橋本慧悟と申します。  地元明石市、淡路市、洲本市そして南あわじ市の皆様にも冒頭感謝を申し上げ、また、質問の機会を下さった与野党…

API / MCP 利用

国立国会図書館 国会会議録 API を構造化

REST: /v1/diet/speeches/search?speaker=橋本慧悟
MCP: search_diet_speeches(speaker="橋本慧悟")