ChatGPT V4 超越了測試,通過了 SAT 並識別了 ETH 合約中的漏洞 | 區塊內幕 Cryptoinsiders

區塊內幕 Cryptoinsiders 消息- GPT-4 成功完成了隊列中前 10% 的許多任務,而 ChatGPT 的原始版本通常在後 10% 中完成。

GPT-4 是人工智能聊天機器人 ChatGPT 的最新版本,能夠在高中和大學水平的考試中取得高分,達到 90% 的分數。 此外,AI 的處理能力有了顯著提高,這在以前的版本中是不可能的。

GPT-4 的測試成績數據於 3 月 14 日由其創建者 OpenAI 發布,這表明它還可以將圖像、音頻和視頻轉換為文本,並且具有更強的能力來生成更有創意和更有效的指令翻譯。

OpenAI 表示,它“通過了一場模擬律師考試,得分在應試者的前 10% 左右”。 相反,GPT-3.5 的得分在倒數 10% 左右。

數據顯示,GPT-4在LSAT 88%的成績中取得了163分,這是進入美國法學院的必備分數

如果得到證實,GPT4 的分數將躋身法學院前 20%,與哈佛、斯坦福、普林斯頓或耶魯等名校錄取所需的報告分數僅差幾分。

之前版本的 ChatGPT 在 LSAT 上的得分為 149,位於倒數 40%。

GPT-4 在統一律師考試中也獲得了 298 分(滿分 400 分)——該考試由最近畢業的法學院學生參加,允許他們在美國任何州從事法律工作。

以前版本的 ChatGPT 在這項任務上遇到了麻煩,在滿分 400 分中以 213 分排名倒數 10%。

關於為評估美國高中生的大學準備情況而進行的 SAT 閱讀和寫作循證測試以及數學測試,GPT-4 得分分別位於第 93 和第 89 個百分位。

GPT-4 在“硬”科學方面也表現出色,在 AP 生物學 (85-100%)、化學 (71-88%) 和物理 2 (66-84%) 中取得了高於平均水平的百分位分數。

然而,它的 AP 微積分分數處於中等水平,排名在 43 到 59% 之間。

GPT-4 的另一個不足之處是英語語言考試,他們在兩次考試中的分數從第 8 到第 44 個百分位不等。

OpenAI 聲稱 GPT-4 和 GPT-3.5 從 2022-2023 實踐考試中進行了這些測試,他們說語言處理工具沒有接受算法的特定訓練:

“我們沒有專門研究這些測試。” 模型在訓練過程中只觀察到測試中的少數問題,但我們相信結果是準確的。”

這些結論也引起了 Twitter 社區的關注。

FactoryDAO 的創建者 Nick Almond 在 3 月 14 日告訴他的 14,300 名推特粉絲,GPT4 將“嚇壞人們”並將“崩潰”全球教育體系。

Coinbase 領導團隊前成員 Conor Grogan 表示,他在 GPT-4 模型中插入了一個實時的以太坊智能合約,並立即指出了幾個“安全問題”,並描述瞭如何利用代碼:

早期對 ChatGPT 的智能合約審計觀察到,它的第一次迭代也能夠在很大程度上標記出代碼缺陷。

AI 時事通訊“The Rundown”的創作者 Rowan Cheung 發布了一段 GPT 將手繪假網站轉錄到一張紙上的視頻。

