What`s new ?

DeepSeekのアハ体験

DeepSeekのコスト面での躍進は教師あり微調整(supervised fine-tuning:SFT) を使わずにほぼ強化学習のみでなり遂げたことによるものだということで技術者はレポートに中でひらめきの比喩であるAha moment(アハ体験?)という言葉を使っています。すぐに大手もキャッチアップすることと考えられるのでLLMのモデルの低負荷化はさらに学習精度を上げる方向に働いていくのは間違いなく…まさに半導体の世界のように進化が用途を増やすことに貢献しそうです。
Please follow and like us:

仕事は半導体デバイス開発。 趣味としているEnduranceスポーツと 日常の出来事を綴ります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です