Kosmos-1 dirancang sebagai teknologi kecerdasan buatan umum.
Cyberthreat.id – Bayangkan ketika login sebuah situsweb yang memakai CAPTCHA atau teka-teki, Anda tak perlu lagi mengkliknya, cukup platform AI yang mengyelesaikannya. Tampaknya, gambaran teknologi itu sebentar lagi bisa terwujud di pasar luas.
Microsoft awal Februari 2023 mengenalkan model AI multimetode bernama "Kosmos-1". Perangkat lunak ini mampu menganalisis gambar, menyelesaikan teka-teki visual, pengenalan teks visual, menyelesaikan tes IQ visual, bahkan diyakini bisa memahami instruksi bahasa alami.
Teknologi berbasis kecerdasan buatan (AI) tersebut, menurut Microsoft, memadukan atau mengintegrasikan berbagai mode input, seperti teks, audio, gambar, dan video. Terobosan ini disebut oleh peneliti sebagai "kunci untuk membangun kecerdasan buatan umum (artificial general intelligence/AGI) yang dapat melakukan tugas-tugas umum manusia," tutur peneliti dalam makalahnya bertajuk "Language Is Not All You Need: Aligning Perception with Language Models" dikutip dari Ars Technica.
Di tengah kegemparan chabot OpenAI, ChatGPT, yang dianggap "begitu pintar" sehingga bakal menggantikan peran manusia di sejumlah pekerjaan, beberapa pakar AI justru menyebut AI multimodal atau multimetode adalah sebuah teknologi potensial menuju kecerdasan buatan umum. AI multimodal, seperti Kosmos-1, menjadi sebuah teknologi hipotesis (prediksi) yang seolah-olah akan bisa menggantikan manusia dalam tugas intelektual apa pun. Terlebih, OpenAI, startup AI yang didanai Microsoft, juga menyatakan, AI multimodal menjadi tujuan yang ingin dicapai.
Namun, "Dalam hal ini, Kosmos-1 tampaknya proyek Microsoft murni tanpa keterlibatan OpenAI," tulis Ars Technica. Para peneliti menyebut kreasi tersebut sebagai 'model bahasa besar multimodal" (MLLM) yang tetap berakar dari model bahasa besar (LLM), seperti ChatGPT.
Peneliti Microsoft melatih Kosmos-1 menggunakan big data dari web. Selain pelatihan, Kosmos-1 didesain untuk mampu menguasai beberapa tes, seperti pemahaman bahasa, pembuatan bahasa, klasifikasi teks bebas pengenalan karakter optik, keterangan gambar, jawaban pertanyaan visual, jawaban pertanyaan halaman web, dan klasifikasi gambar zero-shot (istilah model pembelajaran AI terkait satu set gambar untuk diklasifikasikan).
Di masa mendatang, teknologi Kosmos-1 ini sangat mungkin ditingkatkan model pembelajarannya sehingga "memungkinkan untuk melihat segala bentuk media dan menyelesaikannya", bahkan peneliti memiliki mimpi bahwa model Kosmos-1 dapat diintegrasikan dengan kemampuan bicara.[]
Demokratisasi Kecerdasan Buatan (Artificial Intelligence; AI), pada dasarnya, adalah memperluas aksesibilitas teknologi AI ke basis pengguna yang lebih luas.
Di tengah latar belakang ini, ada aspek penting yang secara halus terjalin dalam narasinya, yaitu penanganan identitas non-manusia.
"Karena kita hidup di era digital, jangan hanya menjadi konsumen, tetapi bisa dimanfaatkan untuk sesuatu yang lebih produktif," tambah Nezar.