Cara Membangun ChatGPT Kustom Dengan Data Anda Sendiri
Table of content:
Menyediakan teknologi GPT dalam chatbot yang kuat dan mudah digunakan, ChatGPT telah menjadi alat AI paling populer di dunia. Banyak orang menggunakan ChatGPT untuk menyediakan percakapan yang menarik, menjawab pertanyaan, menawarkan saran kreatif, dan membantu dalam pengkodean dan penulisan. Namun, ChatGPT terbatas karena Anda tidak dapat menyimpan data untuk penggunaan pribadi jangka panjang, dan titik batas data pengetahuan September 2021.
Sebagai solusinya, kita dapat menggunakan API OpenAI dan LangChain untuk menyediakan data khusus dan info terbaru kepada ChatGPT melewati tahun 2021 untuk membuat instance ChatGPT khusus.
Mengapa Menyediakan ChatGPT dengan Data Khusus?
Memberi makan ChatGPT dengan data khusus dan memberikan informasi terbaru di luar tanggal batas pengetahuannya memberikan beberapa keuntungan dibandingkan hanya menggunakan ChatGPT seperti biasa. Berikut ini beberapa di antaranya:
- Interaksi yang Dipersonalisasi: Dengan memberikan data khusus kepada ChatGPT, pengguna dapat membuat pengalaman yang lebih disesuaikan. Model dapat dilatih pada kumpulan data spesifik yang relevan dengan pengguna individu atau organisasi, menghasilkan respons yang disesuaikan dengan kebutuhan dan preferensi unik mereka.
- Keahlian Khusus Domain: Integrasi data khusus memungkinkan ChatGPT untuk berspesialisasi dalam domain atau industri tertentu. Ini dapat dilatih tentang pengetahuan, terminologi, dan tren khusus industri, memungkinkan tanggapan yang lebih akurat dan berwawasan dalam area spesifik tersebut.
- Informasi Terkini dan Akurat: Akses ke informasi terbaru memastikan bahwa ChatGPT tetap mengikuti perkembangan dan pengetahuan terkini. Itu dapat memberikan respons yang akurat berdasarkan peristiwa, berita, atau penelitian terkini, menjadikannya sumber informasi yang lebih andal.
Sekarang setelah Anda memahami pentingnya memberikan data khusus ke ChatGPT, berikut adalah langkah demi langkah tentang cara melakukannya di komputer lokal Anda.
Langkah 1: Instal dan Unduh Perangkat Lunak dan Skrip Pra-Made
Harap diperhatikan bahwa petunjuk berikut adalah untuk mesin Windows 10 atau Windows 11.
Untuk memberikan data khusus ke ChatGPT, Anda harus menginstal dan mengunduh Python3, Git, Microsoft C++, dan skrip pengambilan ChatGPT terbaru dari GitHub. Jika Anda sudah menginstal beberapa perangkat lunak di PC Anda, pastikan perangkat lunak tersebut diperbarui dengan versi terbaru untuk menghindari masalah selama proses berlangsung.
Mulailah dengan menginstal:
Catatan Instalasi Python3 dan Microsoft C++
Saat menginstal Python3, pastikan Anda mencentang Tambahkan python.exe ke PATH pilihan sebelum mengklik Instal sekarang. Ini penting karena memungkinkan Anda mengakses Python di direktori mana pun di komputer Anda.
Saat Menginstal Microsoft C++, Anda pasti ingin menginstal Alat Bangun Microsoft Visual Studio Pertama. Setelah diinstal, Anda dapat mencentang Pengembangan desktop dengan C++ pilihan dan klik Install dengan semua alat opsional secara otomatis dicentang di sidebar kanan.
Sekarang setelah Anda menginstal versi terbaru Python3, Git, dan Microsoft C++, Anda dapat mengunduh skrip Python untuk meminta data lokal kustom dengan mudah.
Unduh: Skrip pengambilan ChatGPT (Bebas)
Untuk mengunduh skrip, klik Kode, lalu pilih Unduh ZIP. Ini harus mengunduh skrip Python ke direktori default atau yang dipilih.
Setelah diunduh, kita sekarang dapat mengatur lingkungan lokal.
Langkah 2: Siapkan Lingkungan Lokal
Untuk mengatur lingkungan, Anda harus membuka terminal di folder utama chatgpt-retrieval yang Anda unduh. Untuk melakukannya, buka chatgpt-retrieval-main folder, klik kanan, dan pilih Buka di Terminal.
Setelah terminal terbuka, salin dan tempel perintah ini:
pip install langchain openai chromadb tiktoken unstructured
Perintah ini menggunakan manajer paket Python untuk membuat dan mengelola lingkungan virtual Python yang diperlukan.
Setelah membuat lingkungan virtual, kami perlu menyediakan kunci API OpenAI untuk mengakses layanan mereka. Pertama-tama kita harus membuat kunci API dari Situs kunci OpenAI API dengan mengklik Buat kunci rahasia barumenambahkan nama untuk kunci, lalu menekan tombol Buat tombol kunci rahasia.
Anda akan diberikan serangkaian karakter. Ini adalah kunci API OpenAI Anda. Salin dengan mengklik ikon salin di samping kunci API. Perhatikan bahwa kunci API ini harus dirahasiakan. Jangan membaginya dengan orang lain kecuali Anda benar-benar bermaksud agar mereka menggunakannya dengan Anda.
Setelah disalin, kembali ke folder chatgpt-retrieval-main dan buka konstanta dengan Notepad. Sekarang ganti placeholder dengan kunci API Anda. Ingatlah untuk menyimpan file!
Sekarang Anda telah berhasil mengatur lingkungan virtual Anda dan menambahkan kunci OpenAI API Anda sebagai variabel lingkungan. Anda sekarang dapat memberikan data khusus Anda ke ChatGPT.
Langkah 3: Menambahkan Data Kustom
Untuk menambahkan data khusus, tempatkan semua data teks khusus Anda di data folder di dalam chatgpt-retrieval-main. Format data teks dapat berupa PDF, TXT, atau DOC.
Seperti yang dapat Anda lihat dari tangkapan layar di atas, saya telah menambahkan file teks yang berisi jadwal pribadi buatan, artikel yang saya tulis tentang Akselerator Insting AMD, dan dokumen PDF.
Langkah 4: Meminta ChatGPT Melalui Terminal
Skrip Python memungkinkan kita untuk meminta data dari data khusus yang telah kita tambahkan ke folder data dan internet. Dengan kata lain, Anda akan memiliki akses ke backend ChatGPT biasa dan semua data disimpan secara lokal di folder data.
Untuk menggunakan skrip, jalankan python chatgpt.py skrip dan kemudian tambahkan pertanyaan atau kueri Anda sebagai argumen.
python chatgpt.py "YOUR QUESTION"
Pastikan untuk menempatkan pertanyaan Anda dalam tanda kutip.
Untuk menguji apakah kami telah berhasil memberi makan ChatGPT data kami, saya akan mengajukan pertanyaan pribadi tentang Sched.txt Pribadi mengajukan.
Itu berhasil! Ini berarti ChatGPT dapat membaca Personal Sched.txt yang diberikan sebelumnya. Sekarang mari kita lihat apakah kita telah berhasil memberi makan ChatGPT dengan informasi yang tidak diketahuinya karena tanggal batas pengetahuannya.
Seperti yang Anda lihat, ini menggambarkan dengan benar AMD Instinct MI250x, yang dirilis setelah tanggal batas pengetahuan ChatGPT -3.
Keterbatasan ChatGPT Kustom
Meskipun memberi makan GPT-3.5 dengan data khusus membuka lebih banyak cara untuk menerapkan dan menggunakan LLM, ada beberapa kekurangan dan keterbatasan.
Pertama, Anda harus menyediakan semua data sendiri. Anda masih dapat mengakses semua pengetahuan tentang GPT-3.5 hingga tanggal batas pengetahuannya; namun, Anda harus memberikan semua data tambahan. Ini berarti jika Anda ingin model lokal Anda mengetahui subjek tertentu di internet yang belum diketahui GPT-3.5, Anda harus membuka internet dan mengikis sendiri datanya dan menyimpannya sebagai teks di folder data chatgpt-retrieval-main.
Masalah lainnya adalah menanyakan ChatGPT seperti ini membutuhkan lebih banyak waktu untuk memuat jika dibandingkan dengan menanyakan ChatGPT secara langsung.
Terakhir, satu-satunya model yang tersedia saat ini adalah GPT-3.5 Turbo. Jadi meskipun Anda memiliki akses ke GPT-4, Anda tidak akan dapat menggunakannya untuk mendukung instans ChatGPT kustom Anda.
ChatGPT Kustom Luar Biasa Tapi Terbatas
Memberikan data khusus ke ChatGPT adalah cara ampuh untuk memaksimalkan model. Melalui metode ini, Anda dapat memberi makan model dengan data teks apa pun yang Anda inginkan dan memintanya seperti ChatGPT biasa, meskipun dengan beberapa batasan. Namun, hal ini akan berubah di masa mendatang karena integrasi data kami dengan LLM menjadi lebih mudah, bersama dengan akses ke model GPT-4 terbaru.