Panjang konteks yang terbatas pada sejumlah model skala besar merupakan masalah yang signifikan dalam kecerdasan buatan (artificial intelligence/AI).
Model baru InternLM2 ini dikembangkan oleh Laboratorium Kecerdasan Buatan Shanghai, SenseTime, Universitas Hong Kong China, dan Universitas Fudan.
Dalam sebuah eksperimen, para peneliti memberikan transkrip pertemuan publik selama tiga jam kepada model tersebut dan memintanya untuk mengekstrak informasi penting.
Hasil pengujian menunjukkan bahwa meskipun terdapat banyak kesalahan ketik pada teks yang belum dikoreksi, InternLM2 dapat mengekstrak informasi penting secara akurat dan merangkum poin-poin utama pembicara.
Para pengembang tersebut menargetkan untuk memajukan kemampuan pemodelan bahasa dari basis model tersebut dengan meningkatkan kualitas korpus dan kepadatan informasi.
Laboratorium Kecerdasan Buatan Shanghai mengatakan bahwa mereka terus melisensikan InternLM2 untuk penggunaan komersial secara gratis.
Pewarta: Xinhua
Editor: Junaydi Suswanto
Copyright © ANTARA 2024