出典:デジタル大辞泉(小学館)

人工知能における、コンピューターによる機械学習の一種。ディープラーニング強化学習を組み合わせた技術や手法を指す。試行錯誤ののち、正しい選択をした場合は報酬を与え、コンピューター自ら、より正確で効率的な判断ができるよう学んでいく。囲碁対局用のアルファ碁自動運転車の自動運転技術に応用される。