Anthropic釋出Claude 3模型系列:超越GPT-4
當地時間3月4日,Anthropic釋出了最新的Claude 3模型系列,包括Claude 3 Opus、Sonnet和Haiku三個模型。Claude 3 Opus在多個測試資料集中全面超過了GPT-4。Anthropic是一家美國人工智慧(AI)初創公司,由OpenAI前成員Daniela Amodei、Dario Amodei和Jared Kaplan共同創立,專注於開發通用AI系統和大型語言模型。
模型能力和定價
Claude 3 Haiku、Sonnet和Opus三款模型的能力和成本依次遞增,推理速度依次遞減。Claude 3 Opus效能最強,相對的輸出成本最高和輸出時間最長。在數學、程式設計、多語言理解和視覺等多項基準測試中,Claude 3 Opus模型超越了GPT-4和Gemini 1.0 Ultra。Anthropic首次放出了多模態能力,使用者可以上傳各類非結構化資料如照片、圖表等供AI分析。這三個模型均支援長上下文視窗,並向特定客戶開放超過100萬token的上下文輸入能力。
然而,Claude 3模型的定價也高於GPT-4。Claude 3 Opus比GPT-4 Turbo更昂貴:GPT-4 Turbo每百萬token輸入價格為10美元,輸出價格為30美元,而Claude 3 Opus則每百萬token輸入5美元,輸出75美元。
產品詳情和安全性
目前Claude 3 Haiku尚未推送,Sonnet已經免費試用,Opus則需要每月20美元(不含稅)訂閱Claude Pro。相比於ChatGPT,Claude的產品均不能直接連線網際網路查詢資料,注重安全和穩定。
Anthropic開發了“憲法AI”技術,旨在賦予模型一系列原則,產生符合這些原則的文字,例如非有害、有益的內容。Claude 3在安全性和倫理性方面進行了改進,包括更好地管理有害內容和支援有益行為。
資料來源和爬蟲政策
Claude 3的訓練資料來自2023年8月之前公開可獲得的網際網路資訊、第三方提供的非公開資料、資料標註服務和Anthropic專門製作的資料集上訓練。Anthropic採用多種資料清洗和過濾方法,包括去重和分類。Claude 3的模型系列沒有使用任何使用者提交的資料進行訓練。Anthropic遵循行業實踐,尊重網站運營者透過robots.txt指令和其他訊號來指示是否允許爬取其網站內容。
OpenAI的挑戰
在Claude 3釋出前,OpenAI遭遇了馬斯克的訴訟壓力。馬斯克指控OpenAI違背了“確保AI造福人類”的初衷,要求迴歸開源並阻止公司從中獲利。OpenAI一直受到對AGI安全性的質疑,而Claude 3繼續專注於安全和穩定,增加了競爭局勢的複雜性。
在安全和能力之間尋求平衡是當前AI公司的重要挑戰。Anthropic的Claude 3模型系列引領了AI發展的新趨勢,但也凸顯了行業內競爭和道德標準的重要性。
這是真實原創內容,可以在中進行美化排版顯示。Sam Altman的關注點轉向AI安全問題
Sam Altman如今也不得不將注意力從產品、模型中抽出來,轉而關注當下輿論焦點的AI安全問題。就在Claude 3釋出幾分鐘後,Sam Altman也釋出了一條X推文,但他的推文卻與AI大模型技術和產品無關,而是關於一封公開信。
風險投資家Ron Conway和他的公司SV Angel發起了一場名為:Build AI for a Better Future(構建人工智慧,共創美好未來)的聯名公開信活動,旨在強調“最大限度地發揮人工智慧的好處並減輕風險”對社會的“集體責任”。OpenAI、Google、Meta、Y Combinator等科技公司、投資機構參與並簽署了這份聯名公開信。
GPT-4.5(5)和Q*的猜測
目前,關於GPT-4.5(5)和Q*的猜測仍未停止,而OpenAI近期是否真的會發布新模型,讓我們拭目以待。GPT-4和Claude誰強?“跑分”戰勝了GPT-4,但具體模型能力方面,Claude 3和GPT-4的差別到底在哪呢?
Claude 3的多模態理解與處理能力
首先是多模態理解與處理能力,Claude 3能夠處理和理解影象和影片幀輸入,從而解決超出簡單文字理解的複雜多模態推理挑戰。在AI2D科學圖表基準測試中,Claude 3的能力得到了展示,尤其是在視覺問答評估方面。
這項評估涉及到理解和分析圖表,然後根據圖表資訊回答多項選擇題。簡單來說,就像在考試中,你被給了一些圖表(比如柱狀圖、線圖等),然後要回答一些基於這些圖表的問題。Claude 3展現了非常高的準確率,在沒有任何預備知識的情況下就達到了89.2%的準確率,顯示出其擅長理解圖表和回答相關問題。
Claude 3的多語言能力與長文字處理
在長文字處理方面,Claude 3模型支援至少1M個token的上下文,提供了更詳細和可操作的用例,尤其在處理大規模文字資料時可能更有優勢。其多語言能力在多語言數學基準測試中表現出色,顯示出在多語言理解和推理方面具有強大能力。
最後,Claude 3在長文字理解、推理、程式設計以及科學查詢處理方面表現出良好效能,在QuALITY基準測試中的表現尤為突出。
Claude 3的潛在應用方向
Anthropic在Claude 3的釋出部落格中介紹了三款模型的潛在應用方向,包括任務自動化、資料處理、客戶互動等多方面應用,顯示出其商業化潛力。Claude 3的釋出標誌著人工智慧領域的一次重大進步。
Anthropic引入科技巨頭參與C輪融資
在C輪融資中,Anthropic引入了Google、Salesforce、Zoom等技術和服務市場上的ToB科技巨頭。這些合作伙伴的目標是將先進的AI技術融入到他們自己的產品和服務中,以提高效率、創新能力和競爭力。
針對產品和服務的AI技術整合
Anthropic與Zoom展開合作,旨在打造面向客戶的AI產品,注重可靠性、生產力和安全性。這種合作旨在開發解決方案,為企業提供價值,例如改善客戶服務、自動化工作流程和提供決策支援。
與波士頓諮詢集團(BCG)的合作
同時,Anthropic與波士頓諮詢集團(BCG)合作,將負責任的生成式AI技術引入到企業客戶。BCG的客戶可以直接使用Anthropic的AI系統,其中包括最新的模型Claude 2,著重於可靠性、可解釋性和可控性。
多行業客戶群體
Anthropic聲稱已經吸引了來自不同行業的客戶,包括醫療保健、人力資源和教育。該公司主要服務於企業和ToB市場,與OpenAI的合作方式有所不同,更加深入。
這是根據您提供的內容後的原創文章,幷包含了適當的排版,您可以直接將其放入檔案中,使其可以顯示美化的排版。標題也已經被放置在標記之間,並符合人們搜尋習慣。請檢查並使用該內容。