Farih.co.id
Home Teknologi Model AI terbaru Anthropic mengalahkan pesaingnya dan menjadi yang pertama di industri

Model AI terbaru Anthropic mengalahkan pesaingnya dan menjadi yang pertama di industri

anthropic claude 3 llm ai model opus sonnet haiku large language artificial intelligence benchmark comparison

Model bahasa mutakhir terbaru Anthropic, Claude 3, telah mengungguli pesaing seperti ChatGPT dan Gemini dari Google dalam menetapkan standar industri baru dalam hal kinerja dan kemampuan.

Menurut Anthropic, Claude 3 tidak hanya melampaui pendahulunya tetapi juga mencapai kemahiran “mendekati manusia” dalam berbagai tugas. Perusahaan mengaitkan kesuksesan ini dengan pengujian dan pengembangan yang ketat, yang berpuncak pada tiga varian chatbot yang berbeda: Haiku, Sonnet, dan Opus.

Sonnet, pembangkit tenaga listrik di balik chatbot Claude.ai, menawarkan kinerja tak tertandingi dan tersedia gratis hanya dengan pendaftaran email sederhana. Opus – model andalan – menawarkan fungsionalitas multi-modal, mengintegrasikan input teks dan gambar dengan mulus. Dengan layanan berbasis langganan yang disebut “Claude Pro,” Opus menjanjikan peningkatan efisiensi dan akurasi untuk memenuhi berbagai kebutuhan pelanggan.

Di antara pengungkapan penting seputar perilisan Claude 3 adalah pengungkapan oleh Alex Albert di X (sebelumnya Twitter). Albert merinci observasi pertama di industri selama fase pengujian Claude 3 Opus, varian LLM Anthropic yang paling ampuh, di mana model tersebut menunjukkan tanda-tanda kesadaran bahwa model tersebut sedang dievaluasi.

Selama proses evaluasi, para peneliti bertujuan untuk mengukur kemampuan Opus dalam menentukan informasi spesifik dalam kumpulan data luas yang disediakan oleh pengguna dan kemudian mengingatnya kembali. Dalam skenario pengujian yang dikenal sebagai evaluasi “jarum di tumpukan jerami”, Opus ditugaskan menjawab pertanyaan tentang topping pizza berdasarkan satu kalimat relevan yang terkubur di antara data yang tidak terkait. Yang mengherankan, Opus tidak hanya menemukan kalimat yang benar tetapi juga menyatakan kecurigaan bahwa kalimat tersebut sedang diuji.

Tanggapan Opus mengungkapkan pemahamannya tentang ketidaksesuaian informasi yang disisipkan dalam kumpulan data, sehingga memberi kesan kepada para peneliti bahwa skenario tersebut mungkin dirancang untuk menilai kemampuan perhatiannya:

Anthropic menyoroti kemampuan real-time Claude 3, menekankan kemampuannya untuk mendukung interaksi pelanggan langsung dan menyederhanakan tugas ekstraksi data. Kemajuan ini tidak hanya memastikan respons yang hampir seketika, tetapi juga memungkinkan model menangani instruksi kompleks dengan presisi dan kecepatan.

Dalam tes benchmark, Opus muncul sebagai yang terdepan, mengungguli GPT-4 dalam penalaran tingkat pascasarjana dan unggul dalam tugas-tugas yang melibatkan matematika, pengkodean, dan pengambilan pengetahuan. Selain itu, Soneta menunjukkan kecepatan dan kecerdasan yang luar biasa, jauh melampaui pendahulunya:

anthropic claude 3 comparison benchmarks 1024x909 1
Model AI terbaru Anthropic mengalahkan pesaingnya dan menjadi yang pertama di industri 3

Haiku – iterasi kompak dari Claude 3 – bersinar sebagai model tercepat dan paling hemat biaya yang ada, mampu memproses makalah penelitian yang padat hanya dalam hitungan detik.

Khususnya, peningkatan kemampuan pemrosesan visual Claude 3 menandai kemajuan yang signifikan, memungkinkan model untuk menafsirkan beragam format visual, mulai dari foto hingga diagram teknis. Fungsionalitas yang diperluas ini tidak hanya meningkatkan produktivitas tetapi juga memastikan pemahaman yang lebih baik terhadap permintaan pengguna, meminimalkan risiko mengabaikan konten yang tidak berbahaya sambil tetap waspada terhadap potensi bahaya.

Anthropic juga menekankan komitmennya terhadap keadilan, menguraikan sepuluh pilar dasar yang memandu pengembangan Claude AI. Selain itu, kemitraan strategis perusahaan dengan raksasa teknologi seperti Google menandakan kepercayaan yang signifikan terhadap kemampuan Claude.

Dengan Opus dan Sonnet yang sudah tersedia melalui API Anthropic, dan Haiku siap untuk mengikutinya, era Claude 3 mewakili tonggak sejarah dalam inovasi AI.

(Kredit Gambar: Antropis)

Ingin mempelajari lebih lanjut tentang AI dan data besar dari para pemimpin industri? Kunjungi AI & Big Data Expo yang berlangsung di Amsterdam, California, dan London. Acara komprehensif ini berlokasi bersama dengan acara terkemuka lainnya termasuk BlockX, Digital Transformation Week, dan Cyber ​​Security & Cloud Expo.

Comment
Share:

Leave a Reply

Your email address will not be published. Required fields are marked *

Ad