(SeaPRwire) – LOS ANGELES, 02 April 2026 — Fotor, produk AI unggulan yang dimiliki oleh Everimaging, hari ini mengumumkan bahwa hasil riset bersama terbarunya telah diterima sebagai makalah konferensi di ICLR 2026, salah satu konferensi akademik terkemuka di dunia dalam bidang kecerdasan buatan.

Makalah yang berjudul “WEB-COGREASONER: TOWARDS MULTIMODAL KNOWLEDGE-INDUCED COGNITIVE REASONING FOR WEB AGENTS,” ini merupakan tonggak penting dalam era operasi AI otonom. Terobosan ini dicapai melalui upaya kolaboratif oleh Fotor dan universitas/lembaga penelitian bergengsi, yang berhasil menjembatani kesenjangan antara pencapaian akademis dan praktik industri di dunia nyata.
Terobosan Inti: Membuat AI Menguasai “Pengetahuan Tiga Lapis”
Menghadapi halaman web yang kompleks dan gangguan pop-up, agen web tradisional sering terjebak dalam putaran buntu. Untuk memecah kemacetan ini, tim riset bersama mengambil inspirasi dari “Taksonomi Bloom” dalam psikologi pendidikan dan secara inovatif mengusulkan kerangka kerja Web-CogKnowledge.
Kerangka kerja ini mendekonstruksi proses pembelajaran AI menjadi tiga tahap kognitif progresif:
- Pengetahuan Faktual: Memungkinkan AI untuk mengidentifikasi elemen web secara akurat dan memprediksi konsekuensi langsung dari interaksi tunggal.
- Pengetahuan Konseptual: Memberikan AI pemahaman semantik mendalam untuk menyimpulkan fungsi komponen dan menangkap maksud keseluruhan halaman web.
- Pengetahuan Prosedural: Melatih AI dalam perencanaan dan pengambilan keputusan untuk mengeksekusi urutan tindakan dan menangani interupsi tak terduga seperti pop-up.
Didukung oleh sistem ini dan Web-CogDataset (yang dibangun dari 14 website dunia nyata), AI kini memiliki “Rantai Pemikiran Berbasis Pengetahuan (Knowledge-driven Chain of Thought/CoT)” yang kuat untuk penalaran logis mendalam.
Dari Riset ke Produk: Menggerakkan Generasi Berikutnya dari Fotor Agent
Berdasarkan riset ICLR 2026-nya, Fotor telah dilengkapi dengan kemampuan untuk menerjemahkan terobosan akademis menjadi keunggulan produk dengan mengintegrasikan kemajuan ini dengan kerangka kerja agen sumber terbuka terkemuka (misalnya OpenClaw), membuat evolusi berikutnya dari Fotor Agent dalam jangkauan.
Di bawah kerangka kerja Web-CogReasoner, Fotor Agent bergerak melampaui ketergantungan pada kode dasar halaman web (pohon DOM). Dengan memanfaatkan “persepsi visual piksel murni” dan kerangka kerja kognitif lintas platform yang disajikan dalam makalah bersama, Fotor Agent dapat mengelola alur kerja dengan mulus di berbagai versi web, perangkat lunak desktop, dan aplikasi seluler. Ini menandai langkah pasti menuju Kontrol Komputer Universal (Universal Computer Control/UCC), yang memungkinkan pengguna menangani tugas kompleks melalui satu perintah tunggal.
Tentang Fotor
Berdedikasi pada penerapan praktis riset AI tingkat atas, Fotor menjembatani kesenjangan antara arsitektur neural yang kompleks dan alat kreatif yang intuitif. Melalui jaringan riset globalnya yang kuat, Fotor terus menghadirkan pengalaman AI baru kepada lebih dari 800 juta pengguna di seluruh dunia.
Kontak Media:
KONTAK: Coran Huang
EMAIL: coran@fotor.com
WEB: www.fotor.com
Artikel ini disediakan oleh penyedia konten pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberikan jaminan atau pernyataan sehubungan dengan hal tersebut.
Sektor: Top Story, Daily News
SeaPRwire menyediakan distribusi siaran pers real-time untuk perusahaan dan lembaga, menjangkau lebih dari 6.500 toko media, 86.000 editor dan jurnalis, dan 3,5 juta desktop profesional di 90 negara. SeaPRwire mendukung distribusi siaran pers dalam bahasa Inggris, Korea, Jepang, Arab, Cina Sederhana, Cina Tradisional, Vietnam, Thailand, Indonesia, Melayu, Jerman, Rusia, Prancis, Spanyol, Portugis dan bahasa lainnya.
