欧美日韩精品久久久久_国产后进极品翘臀在线_穿丁字内裤带着震蛋被sm_久久大香香蕉国产拍国_精品小视频

今天,大模型都是高考生-環(huán)球播報(bào)

時(shí)間:2023-06-07 21:23:45來(lái)源:多知網(wǎng)
AI 高考作文大比拼。

來(lái)源|多知網(wǎng)


(資料圖片僅供參考)

作者 |王上

圖片來(lái)源 |Pexels

又逢高考,每年作文都是社會(huì)關(guān)注的重點(diǎn)話題。作文的命題是選拔人才的風(fēng)向,也體現(xiàn)了價(jià)值觀的引領(lǐng)。

在各家大模型征戰(zhàn)的當(dāng)下,高考可以說(shuō)是一個(gè)真刀實(shí)槍的競(jìng)技場(chǎng)。多知網(wǎng)選取了北京卷大作文,要求二選一,以 " 亮相 " 為主題寫(xiě)一篇記敘文,或以 " 續(xù)航 " 為主題寫(xiě)一篇議論文。多知網(wǎng)分別讓 GPT-4、ChatGPT ( 3.5 ) 、文心一言、通義千問(wèn)、訊飛星火予以作答。

在同一題目的競(jìng)技下,各家可以說(shuō)都具備寫(xiě)作的能力,但是水平不一。

從審題方面來(lái)說(shuō),文心一言還需提升,它寫(xiě)了兩篇,沒(méi)理解題目 " 任選一 " 的含義。

有意思的是,提問(wèn)方面,首先假設(shè)了各大模型就是一名高考生,沒(méi)有設(shè)定身份。在這種情況下,GPT-4、ChatGPT ( 3.5 ) 、文心一言、通義千問(wèn)、訊飛星火都選擇了寫(xiě)以 " 續(xù)航 " 為主題的議論文。

在給了提示詞,設(shè)定了 " 作文水平很高的北京高中生 " 的身份證后,有的大模型有所進(jìn)步,有的則會(huì)更糟糕。值得注意的是,在設(shè)定了身份之后,只有 GPT-4 選擇了以 " 亮相 " 為主題的記敘文。

從體裁來(lái)看,各個(gè)大模型都理解體裁之間的區(qū)別,也給出了相應(yīng)的書(shū)寫(xiě)要求??梢钥吹?,記敘文的體裁更難一些,門(mén)檻更高。

從文采來(lái)看,ChatGPT 比較嫻熟,GPT-4 更勝幾籌。

GPT-4 與 ChatGPT 相比,GPT-4 能力更強(qiáng),從理解能力、語(yǔ)言組織能力和流暢度等都高出幾個(gè)維度。

值得注意的是,除了 ChatGPT 之外,其余幾個(gè)大模型均未提煉出有亮點(diǎn)的作文題目。

以下為各家大模型的作答情況及點(diǎn)評(píng):

01

考生姓名:GPT-4

點(diǎn)評(píng):結(jié)構(gòu)完整,論點(diǎn)比較詳實(shí)。

加了提示詞 " 作文水平很高的北京高中生 " 后再提問(wèn)的效果——

點(diǎn)評(píng):一篇非常生動(dòng)的記敘文,結(jié)構(gòu)完整,語(yǔ)言流暢。

02

考生姓名:ChatGPT

點(diǎn)評(píng):言之有理,論點(diǎn)鮮明,邏輯清晰。點(diǎn)評(píng):有提示詞后更勝一籌,優(yōu)點(diǎn)是兩篇都有完整的作文題目。

03

考生姓名:文心一言

點(diǎn)評(píng):文心一言可能有糾結(jié)癥,先寫(xiě)了 " 續(xù)航 ",又補(bǔ)充了一篇 " 亮相 "。此外,兩篇都是議論文,不完全符合體裁要求。點(diǎn)評(píng):文心一言加入提示詞后,讀懂了題目。依然選擇了 " 續(xù)航 " 這一主題,語(yǔ)言表達(dá)比第一次有所進(jìn)步。

04

考生姓名:通義千問(wèn)

點(diǎn)評(píng):讀懂了題目,也懂題材??雌饋?lái)中規(guī)中矩。不過(guò),不懂為什么在倒數(shù)第二段夾雜了一段 " 亮相 "。點(diǎn)評(píng):更糟糕了。

05

考生姓名:訊飛星火

點(diǎn)評(píng):讀懂了題目,也懂體裁。還有一段結(jié)合實(shí)際的小例子,看起來(lái)比較符合要求。點(diǎn)評(píng):加了提示詞后,審題錯(cuò)誤寫(xiě)了兩篇。值得肯定的是,明白體裁的區(qū)別。不過(guò),情節(jié)略顯單薄。

您覺(jué)得哪家大模型更符合考官的評(píng)卷標(biāo)準(zhǔn)呢?可以在文末的留言區(qū)告訴我們。

關(guān)鍵詞:

相關(guān)資訊
熱門(mén)頻道