dポイントと交換できるWelcome!スタンプをあつめよう
辞書
《reinforcement learning from human feedback》機械学習において、人間からのフィードバックを用いて強化学習をすること。また、そのような学習モデル。人間による実際の評価を出力結果に反映させることで、対話型AIなどで不適切な質問を拒否するようにしたり、学習データに潜在する差別などのバイアスを除去したりする調整を行う。
出典:デジタル大辞泉(小学館)
1位
2位
3位
4位
5位
6位
7位
8位
9位
10位
11位
12位
13位
14位
15位
過去の検索ランキングを見る