RLHF（アールエルエッチエフ）とは？意味・読み方・使い方
《reinforcement learning from human feedback》

ブックマークへ登録

意味
例文
慣用句
画像

アール‐エル‐エッチ‐エフ【RLHF】
の解説

《reinforcement learning from human feedback》機械学習において、人間からのフィードバックを用いて強化学習をすること。また、そのような学習モデル。人間による実際の評価を出力結果に反映させることで、対話型AIなどで不適切な質問を拒否するようにしたり、学習データに潜在する差別などのバイアスを除去したりする調整を行う。

「アール【R／r】」の全ての意味を見る

出典：デジタル大辞泉（小学館）

RLHF のカテゴリ情報

出典：デジタル大辞泉（小学館）

［IT用語］の言葉

［ABC略語］の言葉

RLHF の前後の言葉

新着ワード

goo辞書とは

goo辞書は無料で使える辞書・辞典の検索サービスです。1999年にポータルサイト初の辞書サービスとして提供を開始しました。出版社による信頼性の高い語学辞典（国語辞書、英和辞書、和英辞書、類語辞書、四字熟語、漢字など）と多種多様な専門用語集を配信しています。すべての辞書をまとめて検索する「横断検索」と特定の辞書を検索する「個別検索」が可能です。国語辞書ではニュース記事や青空文庫での言葉の使用例が確認でき、使い方が分からない時に便利です。