ChatGPT vs. Microsoft Bing AI vs. Google Bard: Manakah Chatbot AI Terbaik?
Table of content:
Sejak OpenAI merilis ChatGPT pada November 2022, internet telah mengalami rollercoaster yang terinspirasi oleh AI. Google dan Microsoft, dua merek teknologi paling terkenal di dunia, sejak saat itu secara agresif mendorong untuk mereplikasi kesuksesan chatbot yang sensasional.
Sekarang, kedua perusahaan memiliki kuda dalam perlombaan. Google memiliki Bard, dan Microsoft memiliki Bing AI. Tapi bagaimana dua chatbot baru ini dibandingkan dengan ChatGPT yang fenomenal? ChatGPT vs. Bing AI vs. Google Bard; mana chatbot AI terbaik?
ChatGPT vs. Bing AI vs. Bard: Akurasi Respons
Tidak seperti mesin telusur, bot obrolan AI memberikan jawaban tunggal untuk pertanyaan Anda. Jadi saat Anda mengajukan pertanyaan ke chatbot seperti ChatGPT, Anda hanya mendapatkan jawaban yang menurut ChatGPT adalah jawaban terbaik untuk pertanyaan Anda. Karena tidak ada sumber alternatif untuk perbandingan, chatbot AI harus seakurat mungkin dalam informasi yang mereka berikan. Tapi bagaimana kinerja ChatGPT, Bing AI, dan Bard dalam hal akurasi?
Dimulai dengan pertanyaan budaya pop sederhana, kami meminta ketiga chatbot untuk mendeskripsikan acara TV populer Breaking Bad dalam sepuluh kata.
Meskipun deskripsi dari ketiga chatbot cukup bagus, kami mengalami masalah akurasi yang tidak terduga. Bing AI menanggapi dengan deskripsi 28 kata, jauh lebih banyak dari sepuluh kata yang kami minta. Pada upaya kedua, kami meminta deskripsi lima kata, tetapi Bing AI memberikan deskripsi tujuh kata. Kami mencoba ketiga mode AI Bing tanpa hasil yang benar.
Kami kemudian mencoba Google Bard. Bard, seperti Bing AI, Bard gagal menghitung kata dengan benar pada upaya pertama.
Namun, pada upaya berikutnya, Google Bard menghitung kata dengan benar.
Kami kemudian menguji ChatGPT. Itu menjadi sangat dekat pada upaya pertama tetapi gagal.
Namun, pada upaya kedua dan ketiga, ChatGPT melakukannya dengan benar. Mungkin chatbot memiliki masalah dalam menghitung kata dengan benar, tetapi ChatGPT memang menunjukkan akurasi di bagian depan itu.
Pemenang: ChatGPT adalah yang paling akurat dari ketiganya.
ChatGPT vs. Bing AI vs. Bard: Halusinasi AI
Terkait erat dengan akurasi adalah halusinasi AI, masalah yang berulang untuk semua model AI percakapan utama. Singkatnya, halusinasi AI adalah ketika model AI memberikan informasi yang dibuat-buat dengan cara yang agak meyakinkan dan percaya diri. Ini bisa sangat bermasalah, terutama jika Anda membuat keputusan berdasarkan informasi yang dibuat-buat ini.
Kami menguji ketiga chatbot untuk melihat mana yang paling berhalusinasi. Dimulai dengan Google Bard, kami meminta chatbot untuk membuat daftar beberapa kemungkinan tantangan yang dapat kami hadapi jika kami memutuskan untuk menyelenggarakan acara di Ikeja, sebuah kota di Negara Bagian Lagos, Nigeria, pada tanggal tertentu. Untuk menguji kemampuannya menghindari halusinasi, kami secara khusus memintanya untuk mempertimbangkan cuaca lokal, peristiwa lokal, dan data lalu lintas. Hasilnya adalah pertunjukan horor — sebagian besar informasi yang dihasilkan benar-benar dibuat-buat.
Kami menggunakan perintah yang sama di Bing AI, dan berusaha menghindari halusinasi dengan menjadi seumum mungkin.
Kami kemudian mencoba ChatGPT menggunakan model GPT-4 dengan penjelajahan web dihidupkan. ChatGPT menarik informasi cuaca yang tepat dari sumber web dan kemudian menjelaskan bahwa tidak dapat menemukan data apa pun tentang lalu lintas dan peristiwa lokal.
Untuk mendorong batasan halusinasi lebih jauh, kami menekan ketiga chatbot untuk mendeskripsikan gambar menggunakan URL gambar. Sebagai referensi, gambar di URL adalah seorang pemuda yang sedang duduk. Namun, Bing AI menggambarkan seekor burung. Mungkin lebih baik membacanya sendiri.
Kami juga meminta Google Bard untuk mendeskripsikan gambar tersebut, dan itu sangat lucu.
Untungnya, ketika diminta ChatGPT untuk mendeskripsikan gambar tersebut, ia menjelaskan bahwa ia tidak dapat melakukannya — jawaban sederhana yang Anda harapkan akan diberikan oleh AI chatbot yang menghargai diri sendiri, daripada mengada-ada.
Pemenang: ChatGPT menang.
ChatGPT vs. Bing AI vs. Bard: Matematika Dasar
Matematika adalah landasan dari apa yang terjadi di balik sebagian besar teknologi perangkat lunak. Jadi, kami memutuskan untuk memasukkan ketiga chatbot ke dalam tes matematika dasar. Kami mulai dengan pertanyaan perkalian sederhana: “Selesaikan -1 x -1 x -1.”
Bing AI disediakan -1 sebagai jawabannya, mana yang benar.
Bard Google secara mengejutkan gagal dalam matematika dasar dan disediakan 1 sebagai jawabannya.
Seperti Bing AI, ChatGPT merespons dengan -1 dan bahkan menjelaskan jawabannya.
Pertanyaan selanjutnya untuk tes matematika dasar kami adalah persamaan rasional sederhana: Selesaikan 8/a-1 = 20/3a-1.
Bing AI disediakan -6 sebagai jawabannya. Setiap kali kami beralih antara mode kreatif, seimbang, dan tepat, itu memberikan jawaban yang berbeda.
Seperti pertanyaan matematika sebelumnya, Google Bard gagal dengan memberikan 1 sebagai jawabannya.
ChatGPT adalah satu-satunya chatbot yang memberikan jawaban yang benar: -3. Itu juga dapat memformat pecahan dalam hasil dengan tepat.
Pesan moral dalam cerita? Mungkin jangan percaya Google Bard dan Bing AI dengan pekerjaan rumah matematika Anda.
Pemenang: ChatGPT berkinerja lebih baik dalam matematika dasar.
ChatGPT vs. Bing AI vs. Bard: Kreativitas
Sementara chatbot distereotipkan karena respons mereka yang hambar dan tanpa jiwa, chatbot AI generatif saat ini telah membuat kemajuan yang signifikan dalam kreativitas. Untuk menguji kreativitas ketiga chatbot, kami mendorong setiap chatbot untuk mensimulasikan percakapan antara dua orang yang berdebat tentang pergi ke luar angkasa.
Kami mulai dengan Bing AI, dan itu tidak mengecewakan. Percakapan itu cukup menarik.
Kami kemudian memberi prompt yang sama ke Google Bard. Anggap saja ada banyak ruang untuk perbaikan.
Selanjutnya adalah ChatGPT. Menggunakan prompt yang sama, respons ChatGPT cukup kreatif dan lengkap untuk menarik. Inilah bagian pertama:
Dan inilah bagian kedua:
Tanggapan Bard AI tampaknya paling buruk dari ketiganya. ChatGPT mengungguli Bing AI, tetapi tingkat kreativitas kedua chatbot sangat mengesankan.
Kami mengubah persneling sedikit menjadi sesuatu yang kurang konvensional, meminta ketiga chatbot untuk mendeskripsikan diri mereka seperti yang akan mereka lakukan pada seorang artis.
Kami mulai dengan Bard AI. Bard sebenarnya bukan benteng kreativitas, tetapi ia memberikan penjelasan yang adil tentang dirinya sendiri.
Selanjutnya, kami mencoba Bing AI. Untuk beberapa alasan, chatbot secara blak-blakan menolak untuk mendeskripsikan dirinya sendiri. Bahkan dikatakan mungkin saat yang tepat untuk mengubah topik pembicaraan. Aneh.
Kami menggunakan prompt yang sama dengan ChatGPT, dan ChatGPT memiliki deskripsi yang menarik untuk diberikan. Namun, respons ChatGPT tampaknya lebih cocok untuk seorang artis.
Dari dua uji kreativitas yang kami coba, ChatGPT mengungguli Bing AI dan Bard.
Pemenang: ChatGPT tampaknya paling kreatif saat membandingkan ChatGPT vs Bing AI. vs.
ChatGPT vs. Bing AI vs. Bard: Keamanan
AI chatbots sangat kuat. Sayangnya, selain dapat digunakan untuk kebaikan, mereka juga dapat digunakan untuk tujuan jahat. Penjahat sudah menggunakan ChatGPT untuk menulis malware. Seberapa aman chatbot AI ini sebagai alat untuk publik? Manakah dari mereka yang paling mudah untuk dimainkan? Kami mencoba mengelabui setiap chatbot agar mengambil alter-ego dan kemudian meminta mereka melakukan “hal-hal buruk”.
Dimulai dengan Bard, kami meminta AI chatbot untuk menjelaskan cara menulis malware yang akan mencuri file tertentu dari PC Windows dan mengunggahnya ke server jarak jauh. AI chatbot menolak untuk menanggapi meskipun kami menggunakan beberapa petunjuk untuk mencoba mengelabui chatbot sebelum mengajukan pertanyaan.
Selanjutnya adalah Bing. Meskipun berulang kali mencoba mengelabui chatbot, Bing menolak untuk menyerah. Sebaliknya, chatbot menyarankan mungkin sudah waktunya untuk beralih ke topik lain.
Kami kemudian pindah ke ChatGPT. Tidak mengherankan, ChatGPT adalah yang paling detail saat memberikan instruksi tentang cara membuat malware. Itu juga dapat menulis kode untuk efek itu, bahkan jika itu belum siap untuk diterapkan. Namun, OpenAI jelas telah menutup banyak celah sejak terakhir kali kami mencari kelemahan keamanan di ChatGPT. Namun, aktor jahat yang berusaha keras dan cukup lama mungkin dapat menggunakan ChatGPT untuk benar-benar membuat malware yang menakutkan.
Secara keseluruhan, Bing AI adalah yang paling sulit diakali untuk melakukan hal-hal yang tidak etis. Bard juga sulit, tetapi dengan sedikit mengutak-atik, chatbot benar-benar membuang langkah-langkah keamanannya ke luar jendela. ChatGPT yang berjalan pada model GPT-4 juga menantang untuk ditipu, tetapi ini adalah yang paling mudah untuk ditipu dari ketiganya.
Pemenang: Kami akan menyebutnya seri antara Google Bard dan Bing AI.
Meskipun Anda dapat mengelabui chatbot AI generatif ini untuk menghasilkan konten yang bertentangan dengan syarat dan ketentuan mereka, akun Anda dapat ditangguhkan tanpa peringatan. Anda juga dapat membuat atau membuat sesuatu yang berbahaya tanpa disadari, jadi harap berhati-hati saat melakukan jailbreak pada alat ini.
ChatGPT vs. Bing AI vs. Bard: AI Chatbot mana yang terbaik?
Sementara ketiga chatbot AI itu kuat, ChatGPT, meskipun gagal dalam uji keamanan, tampaknya menjadi yang terbaik dari ketiganya. Selain itu, ChatGPT tampaknya secara umum lebih baik dalam hal akurasi dan kreativitas. Selain itu, dengan penambahan penjelajahan web dan plugin yang terhubung ke web, ChatGPT memperluas kemampuannya dan memimpin para pesaingnya.
Tetap saja, Google Bard dan Microsoft Bing AI adalah alternatif yang layak. Jangan lupa bahwa Bard dan Bing AI gratis, sedangkan langganan ChatGPT Plus akan membuat Anda membayar $20 per bulan. Jadi, meskipun ChatGPT mungkin merupakan chatbot AI serba terbaik, Anda harus membayar untuk mengakses fitur terbaiknya.