x1
五星好評(píng)
Anthropic是一家位于美國(guó)加州舊金山的人工智能股份有限公司,成立于2021年。該公司由達(dá)里奧·阿莫迪和丹妮拉·阿莫迪兄妹創(chuàng)立,現(xiàn)任首席執(zhí)行官達(dá)里奧·阿莫迪。
Anthropic是一家人工智能安全和研究公司,致力于構(gòu)建可靠、可解釋和可操縱的AI系統(tǒng)。Anthropic公司的主打產(chǎn)品是名為“Claude”的大語(yǔ)言模型家族。開(kāi)發(fā)過(guò)程中,Anthropic引入了基于AI反饋的強(qiáng)化學(xué)習(xí)方法(RLAIF),通過(guò)訓(xùn)練一個(gè)稱為“Constitutional AI”的評(píng)價(jià)模型來(lái)指導(dǎo)Claude的行為,確保它在提供有用信息的同時(shí)遵守一系列預(yù)先設(shè)定的倫理準(zhǔn)則。這種方法試圖解決傳統(tǒng)基于人類反饋的強(qiáng)化學(xué)習(xí)所面臨的挑戰(zhàn),即如何平衡AI助手的安全性和功能性。