Chris Wright, Chief Technology Officer and Senior Vice President, Global Engineering, Red Hat menyatakan, lebih dari tiga dekade lalu, Red Hat melihat potensi bagaimana pengembangan dan lisensi open source bisa menciptakan software yang lebih baik untuk mendorong inovasi IT.
Tiga puluh juta baris kode kemudian, Linux tidak hanya berkembang menjadi software open source yang paling sukses, namun juga menjadi software yang paling sukses hingga saat ini. Komitmen kami terhadap prinsip-prinsip open source terus berlanjut hingga saat ini, tidak hanya dalam model bisnis kami, namun juga dalam budaya perusahaan. Kami yakin bahwa konsep-konsep ini dapat memberikan dampak yang sama terhadap kecerdasan buatan (AI) jika dilakukan dengan cara yang benar. Namun ada perbedaan yang jelas dalam dunia teknologi tentang apa yang dimaksud dengan “cara yang benar”.
AI, terutama large language models (LLMs) yang menggerakkan AI generatif (gen AI), tidak dapat dilihat dengan cara yang sama seperti software open source. Tidak seperti software, model AI pada dasarnya terdiri dari bobot model, yang merupakan parameter numerik yang menentukan bagaimana model memproses input, dan hubungan yang dibuatnya di antara berbagai titik data. Bobot model yang terlatih adalah hasil dari proses pelatihan ekstensif yang melibatkan sejumlah besar data pelatihan yang dipersiapkan, digabungkan, dan diproses dengan cermat.
Meskipun bobot model bukan software, namun dalam beberapa hal bobot model memiliki fungsi yang mirip dengan kode. Tidak sulit untuk menarik perbandingan bahwa data adalah, atau analog dengan, kode sumber dari model. Dalam open source, kode sumber biasanya didefinisikan sebagai ‘bentuk yang lebih disukai’ (preferred form) untuk memodifikasi software. Data pelatihan saja tidak akan sesuai dengan role ini, mengingat ukurannya yang biasanya sangat besar dan proses pre-training yang rumit yang menghasilkan hubungan yang renggang dan tidak langsung antara satu item data pelatihan dengan bobot yang dilatih dan perilaku yang dihasilkan model tersebut.
Mayoritas perbaikan dan peningkatan model AI yang sekarang sedang terjadi di komunitas tidak melibatkan akses atau penyalahgunaan data pelatihan yang asli. Sebaliknya adalah hasil dari modifikasi pada bobot model atau proses penyempurnaan yang juga dapat berfungsi untuk menyesuaikan kinerja model. Kebebasan untuk melakukan perbaikan model tersebut mengharuskan bobot-bobot itu dirilis dengan semua izin yang diterima pengguna di bawah lisensi open source.
Pendapat Red Hat tentang open source AI
Red Hat melihat ambang batas minimum untuk open source AI sebagai bobot model berlisensi open source yang digabungkan dengan komponen software open source. Ini adalah titik awal dari open source AI, bukan tujuan akhirnya. Kami mendorong komunitas open source, otoritas yang berwenang, dan industri untuk terus berusaha menuju transparansi yang lebih besar dan keselarasan dengan prinsip-prinsip pengembangan open source saat melatih dan menyempurnakan model AI.
Ini adalah pandangan Red Hat, tentang bagaimana kami, sebagai ekosistem software open source, dapat secara praktis terlibat dalam open source AI. Ini bukanlah upaya untuk membuat definisi formal, seperti yang sudah dilakukan oleh Open Source Initiative (OSI) dengan Open Source AI Definition (OSAID). Sudut pandang kami hingga saat ini hanyalah pandangan kami tentang apa yang membuat open source AI dapat dicapai dan diakses oleh komunitas, organisasi dan vendor yang paling luas.
Kami menerapkan sudut pandang ini melalui karya kami di komunitas open source, yang ditunjukkan dengan proyek InstructLab yang dipimpin oleh Red Hat dan pekerjaan kami seputar keluarga model berlisensi open source Granite dengan IBM Research. InstructLab secara signifikan mengurangi penghalang untuk kontribusi model AI dari non-data scientist. Dengan InstructLab, para ahli di berbagai bidang dan industri bisa menambahkan keahlian dan pengetahuan mereka ke dalam InstructLab, baik untuk penggunaan internal, maupun untuk membantu mendorong model open source AI yang dapat diakses secara luas untuk komunitas hulu (Upstream community).
Rangkaian model Granite 3.0 menangani berbagai macam kasus penggunaan AI, mulai dari penulisan kode hingga pemrosesan natural language, hingga menggali insight dari dataset yang sangat besar, semuanya dilakukan di bawah lisensi open source yang permisif. Kami membantu IBM Research membawa rangkaian model kode Granite ke dunia open source, dan terus mendukung rangkaian model tersebut, baik dari sudut pandang open source maupun sebagai bagian dari penawaran Red Hat AI kami.
Reaksi yang disebabkan oleh pengumuman baru-baru ini dari DeepSeek menunjukkan bagaimana inovasi open source bisa berdampak pada AI, baik di tingkat model maupun di luarnya. Jelas ada kekhawatiran seputar pendekatan DeepSeek, yaitu bahwa lisensi model tidak menjelaskan bagaimana model tersebut diproduksi, yang semakin memperkuat perlunya transparansi. Namun demikian, disrupsi ini menegaskan pandangan kami tentang masa depan AI: terbuka, berpusat pada model yang lebih kecil, dioptimalkan, dan dapat disesuaikan dengan kasus penggunaan data perusahaan tertentu di mana saja di seluruh hybrid cloud.
Memperluas open source AI di luar model
Teknologi open source dan prinsip-prinsip pengembangannya merupakan inti penawaran AI kami, seperti halnya portofolio AI Red Hat. Red Hat OpenShift AI dibangun di atas fondasi Kubernetes, KubeFlow dan container yang sesuai dengan Open Container Initiative (OCI) bersama dengan sejumlah teknologi cloud-native open source lain. Red Hat Enterprise Linux AI (RHEL AI) menggabungkan keluarga Granite LLM berlisensi open source dari IBM dan proyek open source InstructLab.
Pekerjaan Red Hat dalam bidang open source AI berkembang melampaui InstructLab dan rangkaian model Granite hingga ke tool dan platform yang dibutuhkan untuk benar-benar menggunakan dan memanfaatkan AI secara produktif. Kami aktif dalam proyek dan komunitas hulu yang semakin berkembang, dan telah memprakarsai lebih banyak lagi proyek dan komunitas, termasuk (namun tidak terbatas pada):
- RamaLama, sebuah proyek open source yang bertujuan menjadikan manajemen lokal dan penyediaan model AI jauh lebih mudah dan sederhana;
- TrustyAI, toolkit open source untuk mengembangkan alur kerja AI yang lebih bertanggung jawab;
- Climatik, proyek yang dipusatkan untuk membantu AI menjadi lebih berkelanjutan dalam mengkonsumsi energi
- Podman AI Lab, toolkit pengembang yang fokus untuk membantu eksperimentasi dengan LLM open source;
Pengumuman kami baru-baru ini tentang Neural Magic semakin memperluas visi AI kami, sehingga memungkinkan organisasi untuk menyelaraskan model AI yang lebih kecil dan dioptimalkan, termasuk model berlisensi open source, dengan data mereka, di mana pun data itu berada di hybrid cloud. Organisasi IT kemudian bisa menggunakan server inferensi vLLM untuk mendukung keputusan dan output dari model-model ini, yang membantu membangun AI stack yang dikembangkan di atas teknologi yang transparan dan didukung.
Bagi Red Hat, open source AI ‘hidup dan bernafas’ dalam hybrid cloud. Hybrid cloud memberikan fleksibilitas yang sangat dibutuhkan untuk memilih lingkungan terbaik untuk setiap beban kerja AI, mengoptimalkan kinerja, biaya, peningkatan, dan persyaratan keamanan. Platform, tujuan dan organisasi kami mendukung upaya ini, dan kami berharap dapat berkolaborasi dengan para mitra industri, pelanggan, dan komunitas open source yang lebih luas karena kami akan terus mendorong inovasi open source AI ke depan.
Ada potensi yang sangat besar untuk memperluas kolaborasi terbuka di bidang AI. Kami melihat masa depan yang mencakup kerja yang transparan pada model serta pelatihan mereka. Entah itu minggu depan atau bulan depan (atau lebih cepat, mengingat betapa cepatnya AI berkembang), kami akan terus mendukung dan menerapkan upaya-upaya yang mendorong batas-batas apa yang dimaksud dengan demokratisasi dan keterbukaan dunia AI.
(rr/Syam)
Beningpost | Oleh Mashudi Posted: 27/02/2025 00:21:00 WIB