Tugasan di mana ChatGPT gagal dan cara mengelakkan kesilapannya

Informatec Digital » Sumber » Tugasan di mana ChatGPT gagal dan cara mengelakkan kesilapannya

ChatGPT membuat kesilapan struktur dalam penaakulan, data dan akal sehat, walaupun kelihatan "pintar".
Kesilapan tersebut berpunca daripada kaedah latihan statistik, bias data dan kekurangan pemahaman sebenar.
Banyak profesion dan tugas pendidikan akan berubah, tetapi AI terutamanya akan bertindak sebagai pembantu, bukan sebagai pengganti sepenuhnya.
Menggunakan ChatGPT dengan pengesahan sumber, gesaan yang baik dan semakan manusia membolehkan anda memanfaatkannya tanpa mengambil risiko yang berlebihan.

Kecerdasan buatan generatif telah menyelinap masuk ke dalam kehidupan seharian kita, dan ChatGPT telah menjadi alat utama untuk menulis, meringkaskan, menjadualkan atau mencari ideaWalau bagaimanapun, walaupun ia kelihatan mengagumkan, ia jauh daripada sempurna. Mempercayai jawapannya secara membuta tuli boleh menyebabkan lebih daripada satu kejutan yang tidak menyenangkan jika anda tidak mengetahui subjek tersebut dengan baik. di mana ia tempang.

Itulah sebabnya semakin ramai pakar menegaskan bahawa Memahami tugasan yang menyebabkan ChatGPT gagal adalah sama pentingnya dengan mengetahui cara menggunakannya.Ia bukan tentang memburukkan teknologi, tetapi tentang belajar untuk hidup dengan batasannya: bila ia boleh dipercayai, bila perlu menerima jawapannya dengan serius, dan cara menggunakannya tanpa kehilangan pertimbangan kritis manusia.

Mengapa penting untuk mengetahui batasan ChatGPT

Di sebalik antara muka sembang terletaknya sistem kompleks yang Ia menggabungkan model bahasa yang besar dengan mekanisme dalaman yang mengutamakan kelajuan atau penaakulan bergantung pada soalan."Keputusan" automatik ini tidak selalunya selaras dengan keperluan pengguna: kadangkala tindak balas yang cepat diutamakan walaupun masalah tersebut memerlukan pemikiran langkah demi langkah. Anda boleh mendalami bagaimana parameter kecerdasan buatan mempengaruhi tingkah laku tersebut.

Tambahan pula, tingkah laku model berubah dengan setiap kemas kini, yang menjadikannya ChatGPT mungkin memberi respons yang berbeza kepada pertanyaan yang sama pada masa yang berbezaTambahan pula, terdapat batasan konteks dalam perbualan yang panjang, di mana ia mula "melupakan" bahagian thread dan penapis keselamatan yang menyekat topik sensitif atau sah sepenuhnya kerana terlalu berhati-hati.

Gabungan faktor ini bermakna bahawa, dalam praktiknya, Pengalaman pengguna boleh berubah daripada cemerlang kepada mengecewakan dalam beberapa saat.Perbezaan antara hasil yang berguna dan yang buruk biasanya terletak pada sama ada pengguna dapat mengesan bila AI tersasar dan cara mengalihkannya.

Beberapa kajian dan tinjauan terkini menunjukkan bahawa Sebahagian besar pengguna tidak sepenuhnya mempercayai respons ChatGPT.Dalam satu tinjauan OCU, ramai orang menyebut "kekurangan kepercayaan" terhadap maklumat yang dihasilkan sebagai sebab utama mereka tidak menggunakannya setiap hari, walaupun telah mencubanya.

Oleh itu, pakar dalam kecerdasan buatan dan pendidikan mengesyorkan Gunakan ChatGPT sebagai sumber tambahan dan jangan sekali-kali sebagai penentu kebenaran yang muktamadMengesahkan data dengan sumber lain, mempunyai pengetahuan minimum tentang subjek dan menganggap bahawa maklumat boleh direka-reka (yang terkenal sebagai "halusinasi") adalah wajib pada masa kini.

Ralat biasa dan batasan teknikal ChatGPT

Tugasan di mana ChatGPT sering melakukan kesilapan

Literatur teknikal telah mendokumentasikan bahawa Sistem ini cenderung menghasilkan jawapan yang munasabah tetapi palsu.terutamanya apabila soalan itu samar-samar, sangat spesifik atau menyimpang daripada data yang mereka lihat semasa latihan. Masalahnya ialah perkataannya begitu meyakinkan sehingga sukar untuk mengesan ralat jika pengguna tidak biasa dengan topik tersebut. Alatan seperti sambungan untuk mengesan kandungan yang dijana AI Mereka boleh membantu mengenal pasti beberapa halusinasi tersebut.

Pakar seperti Profesor Josep Curto menekankan bahawa Sebahagian daripada kegagalan yang paling biasa adalah serius dan menjejaskan kebolehpercayaan keseluruhan sistem.Antaranya, beliau menyebut penerangan yang salah tentang fakta yang boleh disahkan, jawapan yang tidak lengkap, penjelasan yang direka-reka tentang "proses penaakulan" model, dan tingkah laku yang kurang tepat dalam bahasa selain Bahasa Inggeris.

Tambahan pula, walaupun penambahbaikan sedang diperkenalkan, Sekatan etika dan keselamatan tidak selalunya dikalibrasi dengan baikKadangkala mereka menyekat permintaan yang sah sambil membenarkan permintaan lain yang bermasalah, atau mereka menghasilkan respons yang sarat dengan bias yang diwarisi daripada data latihan, sama ada berkaitan budaya, politik atau jantina.

Walau bagaimanapun, kajian berterusan dalam pembelajaran mendalam dan pemprosesan bahasa semula jadi telah membawa kepada Versi terkini, seperti GPT-4, mencapai prestasi hampir seperti manusia dalam tugas yang kompleks matematik, pengaturcaraan, undang-undang, perubatan atau psikologi. Tetapi prestasi tinggi tidak bermakna kesempurnaan, dan titik buta masih wujud.

Cara melumpuhkan atau memintas ringkasan AI dalam Google

7 tugasan di mana ChatGPT gagal (atau tidak boleh dipercayai)

Walaupun ChatGPT boleh menjadi sangat berguna dalam banyak situasi, terdapat beberapa jenis tugas di mana kebarangkalian untuk mendapatkan jawapan yang salah, berat sebelah atau mengelirukan meningkat dengan ketaraAdalah penting untuk membiasakan diri dengan senario ini bagi memastikan anda sentiasa berhati-hati.

1. Penaakulan logik dan matematik kompleks

Apabila masalah itu menuntut pengiraan berantai, demonstrasi logik atau bukti matematik formalChatGPT sering melakukan kesilapan. Ia boleh tersilap dalam operasi mudah, melangkau langkah utama atau menunjukkan hasil yang salah sebagai betul.

Ini amat ketara dalam latihan dengan banyak langkah pertengahan, kombinatorik, kebarangkalian, algebra lanjutan atau geometriWalaupun teks mungkin kelihatan berhujah dengan baik, kesilapan kecil dalam satu langkah akan menjejaskan keseluruhan hasil, dan model tidak mempunyai cara untuk benar-benar "memeriksa" penaakulannya sendiri.

2. Akal sehat, intuisi, dan konteks manusia

AI mentafsirkan apa yang diceritakan secara literal, jadi Dia mendapati sukar untuk memahami ironi, makna berganda, sindiran atau rujukan budaya yang sangat setempat.Ini membawa kepada tindak balas yang, kepada manusia, jelas "tidak kena pada tempatnya".

Apabila tugas menuntut empati yang tulen, pemahaman emosi yang mendalam, atau pengetahuan praktikal tentang dunia sebenarModel ini hanya meniru corak bahasa, tetapi tanpa pengalaman peribadi. Ia mungkin kedengaran empati, tetapi ia tidak merasakan apa-apa dan melihat situasi seperti yang dilakukan oleh seseorang. Untuk memperbaiki nada dan menyesuaikan respons, adalah dinasihatkan sesuaikan ChatGPT dan melaraskan gaya serta peranan.

3. Ingatan jangka panjang dan kesinambungan projek

Walaupun nampaknya dia "ingat" perbualan itu, ChatGPT mempunyai konteks yang terhad dan mungkin kehilangan sebahagian daripada sejarah tanpa notis.Perbualan atau projek yang sangat panjang dan berlarutan akhirnya akan mengalami kehilangan ingatan.

Ini secara langsung memberi kesan tugas seperti menulis buku, laporan yang luas atau projek pengaturcaraan berbilang sesiJika kandungan tidak disimpan dan diuruskan secara luaran, terdapat risiko kehilangan konsistensi, mengulangi keputusan yang telah dibuat atau bercanggah dengan diri sendiri tanpa disedari oleh model.

4. Penjimatan masa yang sepatutnya akhirnya akan menyebabkan anda lebih banyak kerugian

Ramai orang beralih kepada ChatGPT untuk mendapatkan perkhidmatan yang lebih pantas, tetapi Apabila jawapan mengandungi ralat yang halus atau tiada maklumat penting, semakan dan pembetulan boleh mengambil masa yang lebih lama daripada bermula dari awal.Ini sangat ketara dalam tugas profesional yang memerlukan standard kualiti yang tinggi.

Di kawasan seperti laporan teknikal, dokumentasi undang-undang, kandungan akademik atau kod pengeluaranMasa tambahan yang diluangkan untuk pengesahan boleh mencairkan sepenuhnya manfaat penggunaan AI jika tiada proses semakan yang ketat.

5. Data ketinggalan zaman dan kekurangan sambungan masa nyata

Model seperti GPT-3 atau GPT-4 dilatih menggunakan set data jangka masa, jadi Mereka tidak mempunyai akses langsung ke web untuk mendapatkan maklumat masa nyataBergantung pada versi, pengetahuan anda mungkin berhenti pada tahun tertentu.

Ini bermakna bahawa, dalam hal-hal peristiwa semasa, perubahan perundangan baru-baru ini, perkembangan saintifik atau berita terkiniJawapan mungkin ketinggalan zaman atau hanya palsu. Jika pengguna tidak menyemak dengan sumber yang dikemas kini, ralat tersebut tidak disedari.

6. Prestasi dan ketepuan yang berubah-ubah

Semasa tempoh permintaan tinggi, terutamanya untuk akaun percuma, Kualiti dan kelajuan respons mungkin terjejasModel tersebut mungkin menjawab dengan kurang terperinci, memotong respons lebih awal atau memberikan penyelesaian yang lebih dangkal.

Kepelbagaian ini bermaksud bahawa Ia tidak selalunya pengganti yang boleh dipercayai untuk tugas kritikal dengan tarikh akhir yang ketat.Bergantung sepenuhnya pada perkhidmatan semasa waktu puncak tanpa pelan sandaran boleh menjadi risiko operasi untuk perniagaan dan profesional.

7. Sekatan, penapis dan bias

Atas sebab keselamatan, ChatGPT merangkumi Penapis untuk mencegah kandungan berbahaya, menyalahi undang-undang atau sangat sensitifMasalahnya ialah sistem penyederhanaan ini tidak sempurna dan kadangkala menyekat permintaan yang sah atau memberi respons samar-samar kerana terlalu berhati-hati.

Komet: Navigator Perplexity Merevolusikan Navigasi AI

Walaupun begitu, beberapa penyelidik telah menunjukkan bahawa Model-model tersebut boleh terus menjana respons dengan bias perkauman, seksis atau ideologi.mencerminkan bias yang terdapat dalam data latihan. Kes-kes telah didokumenkan mengenai bot yang dilatih dengan teknik serupa yang akhirnya menghasilkan kandungan diskriminatif. penilaian etika chatbot Ia membantu untuk memahami dan mengurangkan bias ini.

Kesilapan asas: mengapa ChatGPT melakukan begitu banyak kesilapan

Dalam menganalisis kegagalan ini, ahli falsafah minda dan pakar AI menunjukkan batasan struktur: ChatGPT tidak berfikir, memahami atau menyedari apa yang dikatakannyaKecerdasan mereka yang ketara muncul daripada korelasi statistik berskala besar, bukan daripada penaakulan yang tulen.

Profesor Ned Block, sebagai contoh, telah menunjukkan eksperimen dengan model imej generatif di mana Anda diminta melukis jam yang menunjukkan waktu seperti 12:03 atau 6:28, dan hampir selalu jam muncul pada pukul 10:10.Waktu itu mendominasi dalam foto pengiklanan dalam talian kerana ia menarik dari segi estetika dan tidak mengaburkan logo.

Tingkah laku ini menggambarkan bagaimana Model cenderung untuk meniru corak yang paling kerap dalam data latihan mereka, walaupun ia bercanggah dengan arahan khusus.Mereka tidak "memahami" konsep masa: mereka hanya mengulangi tetapan yang paling biasa secara statistik.

Sesuatu yang serupa berlaku apabila imej diminta seseorang menulis dengan tangan kiri merekaBanyak model akhirnya menjana aksara tangan kanan secara sistematik kerana kebanyakan contoh dalam data juga tangan kanan. Mencapai aksara tangan kanan yang diwakili dengan baik memerlukan penggunaan gesaan yang sangat spesifik secara berterusan, dan walaupun begitu, ia tidak selalunya berfungsi.

Kegagalan struktur jenis ini menyebabkan Malah pembangun tidak dapat membetulkan sepenuhnya beberapa bias yang telah berakar umbiLatihan pengukuhan dengan maklum balas manusia membantu, tetapi pengukuhan secara manual semua kemungkinan kes (semua waktu jam, semua postur menulis, dsb.) adalah tidak praktikal.

Pada peringkat tekstual, masalah tersebut diterjemahkan kepada penjelasan yang terlalu yakin tentang perkara yang sebenarnya tidak "ditahu" oleh modelDia boleh memperincikan langkah demi langkah kaedah yang dikatakannya tidak pernah dilaksanakannya atau mereka-reka rujukan akademik dan menghubungkannya dengan gaya yang meyakinkan sepenuhnya.

Bagaimana ChatGPT berlatih dan mengapa itu mempengaruhi kesilapannya

Model seperti GPT-3 dan GPT-4 adalah berdasarkan seni bina Transformer, dan Mereka telah dilatih tentang sejumlah besar teks dari Internet: laman web, buku, artikel saintifik, berita dan sumber awam lain seperti Wikipedia atau Common Crawl.

Proses ini mempunyai dua fasa utama. Pertama, a latihan pra-besar-besaran di mana model belajar untuk meramalkan perkataan seterusnya dalam berjuta-juta ayatPada peringkat ini, "tatabahasa" yang eksplisit tidak diajar, tetapi corak disimpulkan dengan mengisi ruang kosong dalam teks, sejenis latihan melengkapkan perkataan yang besar.

Kemudian penalaan halus dilakukan untuk tugas-tugas tertentu, seperti terjemahan, ringkasan, jawapan kepada soalan atau dialog perbualanDi sinilah data yang lebih kecil dan lebih spesifik memainkan peranan, dilabelkan untuk mengajar model jenis respons yang dianggap sesuai dalam setiap konteks.

Dalam kes ChatGPT, ia juga telah digunakan Pembelajaran pengukuhan dengan maklum balas manusia (RLHF)Jurulatih manusia menilai beberapa kemungkinan respons daripada model terhadap input yang sama dan menyusunnya dari yang terbaik hingga yang terburuk. Dengan maklumat ini, sistem belajar untuk memilih output yang dinilai tertinggi.

Pendekatan ini meningkatkan kualiti respons yang dirasakan, tetapi tidak menghapuskan masalah yang mendasari: Model ini masih kekurangan pemahaman semantik dan akses langsung kepada realiti.Ia hanya meningkatkan peluang anda untuk kedengaran lebih membantu, sopan, dan yakin, yang kadangkala menjadikan halusinasi lebih berbahaya.

Tambahan pula, walaupun teknik pembersihan data, regularisasi dan penilaian manusia digunakan untuk mengurangkan bias dan stereotaip yang terdapat dalam teks latihanMustahil untuk menapisnya sepenuhnya. Itulah sebabnya syarikat mengesyorkan pemantauan output secara berterusan, terutamanya dalam aplikasi sensitif.

Kesan ChatGPT terhadap pengajian dan dunia pekerjaan

Sejak pelancarannya, ChatGPT telah membangkitkan semula perdebatan tentang Bagaimanakah AI generatif akan mempengaruhi pekerjaan manusia dan sistem pendidikan?Syarikat teknologi besar membentangkannya sebagai "juruterbang bersama" atau pembantu, tetapi banyak kajian menunjukkan transformasi mendalam dalam pelbagai profesion.

Keperluan perkakasan untuk menggunakan Ollama tanpa gangguan

Kajian daripada universiti seperti Universiti New York dan Universiti Pennsylvania, berserta analisis daripada OpenAI dan entiti lain, menunjukkan bahawa tugasan berasaskan bahasa (penulisan, terjemahan, analisis teks, dokumentasi, perakaunan asas) Mereka amat terdedah kepada automasi separa.

Dalam pasaran buruh, mereka telah dikenal pasti sebagai yang paling terdedah telepemasar jualan, profesor bahasa dan kesusasteraan universiti, guru sejarah atau undang-undang, penterjemah, kakitangan pentadbiran dan profil penulisan tertentuIni tidak bermakna semuanya akan hilang, tetapi ia bermakna sebahagian besar fungsi mereka akan dapat bergantung sepenuhnya pada AI.

Kajian-kajian lain mendapati kesan positif yang jelas. Dalam ujian dengan pembangun perisian, sebagai contoh, Mereka yang menggunakan pembantu pengekodan berdasarkan model yang serupa menyelesaikan tugasan sehingga 55% lebih pantas berbanding mereka yang bekerja tanpa bantuan. Produktiviti dalam tugas rutin meningkat, membolehkan lebih banyak masa dikhaskan untuk masalah yang kompleks.

Dalam pendidikan, perdebatan ini amat hangat. Terdapat pengalaman yang menunjukkan bahawa Semakin sukar untuk membezakan sama ada esei pendek telah ditulis oleh pelajar atau ChatGPTwalaupun untuk guru berpengalaman dan penulis profesional. Dalam beberapa eksperimen, guru dan pakar gagal mengenal pasti penulis sebenar.

Sebagai tindak balas kepada perkara ini, ramai pendidik mula meningkatkan lebih banyak penilaian lisan, kerja kelas dan aktiviti yang menunjukkan proses pemikiran pelajarbukan sekadar produk akhir. Ada juga yang mencadangkan penggunaan ChatGPT sebagai alat pengajaran: titik permulaan yang mesti dikritik, diperbetulkan, dibandingkan dengan sumber sebenar dan diperbaiki oleh pelajar.

Amalan terbaik untuk menggunakan ChatGPT tanpa terjebak dalam perangkapnya

Walaupun terdapat semua masalah ini, ChatGPT sangat berguna jika diberi peranan yang betul. Kuncinya terletak pada menggabungkan reka bentuk segera yang baik dengan kawalan manusia yang ketat terhadap apa yang dihasilkannyaterutamanya apabila terdapat implikasi akademik, perundangan atau profesional.

Cadangan asas pertama ialah Sentiasa sahkan fakta, angka, rujukan dan nama yang betul. sebelum menggunakannya. Tidak cukup untuk "kedengaran bagus": anda perlu menyemak dengan sumber yang boleh dipercayai (artikel saintifik, perundangan rasmi, buku rujukan, pangkalan data khusus, dll.).

Ia juga senang Jangan mendasarkan keputusan kritikal pada satu respons model sahaja.Apabila perkara itu penting, adalah bijak untuk membandingkan beberapa pendapat (alat lain, pakar manusia, dokumentasi) dan menggunakan sembang hanya sebagai sokongan atau penjana draf.

Reka bentuk arahan mempunyai impak yang besar: Gesaan yang jelas, khusus dan berstruktur dengan baik mengurangkan kekaburan dan cenderung menghasilkan output yang lebih bergunaMeminta mereka menjelaskan penaakulan mereka langkah demi langkah, memasukkan contoh balas atau menunjukkan kemungkinan batasan boleh membantu mengesan ralat.

Akhir sekali, menggunakan ChatGPT sebagai penjana templat, rangka, draf dan senarai idea yang kemudiannya diusahakan oleh orang ituDaripada hanya menerima teks akhir, ini menjimatkan masa pada aspek yang lebih mekanikal, tetapi kandungan akhir masih diolah semula dan disahkan oleh manusia.

Pengalaman beberapa tahun kebelakangan ini menunjukkan bahawa Kecerdasan buatan generatif berfungsi dengan baik apabila kita menganggapnya sebagai pembantu yang berkuasa tetapi mudah tersilapDengan semangat kritis, pertimbangan yang baik dalam memilih tugasan, dan sistem semakan yang serius, ia menjadi sekutu yang berharga dan bukannya risiko senyap.

artikel berkaitan:

Cara menyesuaikan ChatGPT dan memperhalusi respons anda seperti seorang profesional

Isi kandungan

Mengapa penting untuk mengetahui batasan ChatGPT
Ralat biasa dan batasan teknikal ChatGPT
7 tugasan di mana ChatGPT gagal (atau tidak boleh dipercayai)
Kesilapan asas: mengapa ChatGPT melakukan begitu banyak kesilapan
Bagaimana ChatGPT berlatih dan mengapa itu mempengaruhi kesilapannya
Kesan ChatGPT terhadap pengajian dan dunia pekerjaan
Amalan terbaik untuk menggunakan ChatGPT tanpa terjebak dalam perangkapnya