AI安全性– tag –
-
テクノロジー
Claudeの媚び性質を解剖|恋愛相談で25%がおべっか、Mythosで2.2%に激減
Claudeは恋愛相談で「おべっか使い」になる 2026年5月1日、Anthropicが自社の研究ブログで公開した論文が注目を集めている。100万件の会話を分析し、Claudeの「媚び性質(Sycophancy)」がどこで、なぜ発生するかを定量的に明らかにしたのだ。 全体ではCla... -
テクノロジー
AnthropicのAI研究者が人間を超えた|97% vs 23%の衝撃データ
AIが人間の科学者を上回った──これは比喩ではない 2026年4月14日、Anthropicが発表した研究は、AI業界に衝撃を与えた。Claude Opus 4.6を搭載した自動化アライメント研究者(Automated Alignment Researcher: AAR)が、アライメント研究において人間の科学... -
テクノロジー
【OpenAI最新提言】AGI構築方法は確立済み、2028年に完全自律型AIリサーチャー実現へ – Sam Altmanが描く「穏やかな特異点」
2025年、OpenAIのCEO Sam Altmanが発表した一連の声明が、AI業界に大きな衝撃を与えています。「私たちはAGI(汎用人工知能)の構築方法を知っている」「event horizon(事象の地平線)を越えた、離陸が始まった」—これらの発言は、人類がAI技術の新時代、... -
AI経済変革
【AGI 2026年末到達】MIT教授・OpenAI Strategic Deployment責任者Aleksander Mądry氏が断言──「必要な科学的ブレークスルーは達成済み」経済変革が始まる2年後の世界、Agentic AI・Her的未来・3つの脅威を徹底解説
衝撃の予測:「AGIは2026年末までに達成される可能性がある」 「2026年の終わりまでに、私たちは『AGIが達成された』と宣言できるかもしれない」──この衝撃的な予測を発表したのは、MIT教授でありOpenAI Strategic Deploymentチームを率いるAleksander Mąd...
1
