• 意味
  • 例文
  • 慣用句
  • 画像

reinforcement learning from human feedback機械学習において、人間からのフィードバックを用いて強化学習をすること。また、そのような学習モデル。人間による実際評価を出力結果に反映させることで、対話型AIなどで不適切な質問拒否するようにしたり、学習データに潜在する差別などのバイアス除去したりする調整を行う。

goo辞書は無料で使える辞書・辞典の検索サービスです。1999年にポータルサイト初の辞書サービスとして提供を開始しました。出版社による信頼性の高い語学辞典(国語辞書、英和辞書、和英辞書、類語辞書、四字熟語、漢字など)と多種多様な専門用語集を配信しています。すべての辞書をまとめて検索する「横断検索」と特定の辞書を検索する「個別検索」が可能です。国語辞書ではニュース記事や青空文庫での言葉の使用例が確認でき、使い方が分からない時に便利です。

gooIDでログインするとブックマーク機能がご利用いただけます。保存しておきたい言葉を200件まで登録できます。