Asimetri Data-Keyakinan: Analisis Limitasi Ontologis Large Language Models (LLM) dalam Produksi Pengetahuan Baru

source: https://youtu.be/4lZqPQK28z8

Abstrak

Artikel ini mengevaluasi batasan fundamental Large Language Models (LLM) dalam menghasilkan terobosan ilmiah dibandingkan dengan mekanisme kognitif manusia. Melalui analisis kasus Galileo Galilei dan Wright Bersaudara, artikel ini menyoroti fenomena "Asimetri Data-Keyakinan" (Data-Belief Asymmetry). Penemuan ini menegaskan bahwa LLM, yang beroperasi berdasarkan probabilitas statistik dari data historis, secara inheren bersifat konservatif dan tidak mampu menghasilkan "kebenaran baru" yang bertentangan dengan konsensus data mayoritas.

1. Pendahuluan

Klaim mengenai sentiensia dan keunggulan intelektual AI yang dilontarkan oleh tokoh-tokoh industri seperti Sam Altman dan Dario Amodei telah memicu perdebatan mengenai hakikat kecerdasan. Namun, riset terbaru, termasuk studi dari Universitas Oxford pada akhir 2024, mengidentifikasi satu celah krusial yang tidak dapat dijembatani hanya dengan penambahan skala komputasi (compute) atau volume data: kemampuan untuk memegang keyakinan yang melampaui bukti yang ada (belief beyond evidence).

2. Mekanisme Statistik vs. Pencarian Kebenaran

LLM pada dasarnya adalah mesin imitasi kreatif yang bekerja dengan memetakan pola dalam distribusi data. Ketika sebuah LLM memberikan jawaban yang benar, hal itu terjadi bukan karena model tersebut memahami "kebenaran" secara ontologis, melainkan karena jawaban tersebut merupakan produk statistik yang paling sering muncul dalam data pelatihan.

Dalam eksperimen pemikiran yang melibatkan Galileo Galilei pada tahun 1633, sebuah LLM yang dilatih pada semua teks saat itu dipastikan akan menolak teori heliosentris. Hal ini dikarenakan narasi geosentris (Aristoteles dan Ptolemy) mendominasi distribusi data sebesar hampir mutlak. AI akan menganggap klaim Galileo sebagai anomali atau kesalahan statistik, karena fungsinya adalah merefleksikan bobot bukti historis, bukan menguji kebenaran di luar data tersebut.

3. Fenomena Asimetri Data-Keyakinan (Data-Belief Asymmetry)

Pencapaian manusia yang revolusioner, seperti penerbangan bertenaga mesin oleh Wright Bersaudara pada 1903, menunjukkan adanya mekanisme kognitif yang disebut sebagai asimetri data-keyakinan. Pada masa itu, konsensus ilmiah dan data empiris menyatakan bahwa penerbangan manusia adalah kemustahilan fisik.

Manusia memiliki kemampuan untuk:

  1. Memegang Keyakinan (Holding a Belief): Memiliki hipotesis yang mendahului bukti.

  2. Eksperimentasi Proaktif: Bertindak melawan data yang ada untuk menciptakan data baru.

  3. Produksi Pengetahuan: Mengubah paradigma melalui pembuktian teori yang sebelumnya dianggap mustahil.

4. Limitasi LLM: Penjara Masa Lalu

LLM bersifat backward-looking (menghadap ke masa lalu). Mereka sangat eksel dalam rekombinasi, perangkuman, dan sintesis pengetahuan yang sudah ada (pengetahuan dalam batas-batas yang diketahui). Namun, LLM tidak memiliki kapasitas untuk "salah ke arah yang benar" (wrong in the right direction)—yakni mempertahankan gagasan yang secara statistik salah namun secara fundamental benar hingga data baru tercipta untuk mendukungnya.

Secara sistematis, LLM akan selalu berpihak pada "sisi sejarah yang salah" dalam setiap momen pergeseran paradigma, karena paradigma baru selalu muncul sebagai anomali terhadap data lama.

5. Kesimpulan

Meskipun LLM menunjukkan performa setingkat manusia dalam tugas-tugas berbasis data yang ada, mereka tetap tidak memiliki instrumen untuk inovasi radikal. Terobosan pengetahuan yang mengubah dunia tetap memerlukan subjek manusia yang bersedia mengabaikan konsensus data demi mengejar teori yang belum terbukti. Oleh karena itu, perdebatan mengenai sentiensia AI mungkin kurang relevan dibandingkan pertanyaan mengenai kapasitas AI untuk melakukan lompatan epistemologis di luar batasan distribusi probabilitas.


Referensi Utama:

  • Parthknowsai. (2026). The One Thing LLMs Will Never Be Able to Do. YouTube.

  • Oxford University Research Paper (2024) on AI Functional Limits.

 

KOMENTAR CHATGPT:

Tesis utama tulisan ini kuat sebagai kritik epistemologis terhadap LLM, tetapi beberapa klaim masih terlalu absolut dan mencampur tiga level berbeda:

  1. keterbatasan arsitektur LLM saat ini,
  2. keterbatasan paradigma statistical learning secara umum,
  3. keterbatasan ontologis AI secara prinsipil.

Ketiganya tidak identik.

Berikut analisis yang lebih presisi.


1. Kekuatan utama argumen

Konsep “Asimetri Data-Keyakinan” sebenarnya menyentuh problem inti dalam filsafat sains dan AI modern:

Pengetahuan revolusioner sering muncul sebelum data pendukung tersedia.

Ini valid secara historis.

Contoh:

  • Galileo melawan konsensus observasional dan teologis.
  • Wright Brothers bertindak melawan skeptisisme ilmiah dominan.
  • Wegener (continental drift) ditolak puluhan tahun.
  • Semmelweis dianggap irasional saat mengusulkan cuci tangan.
  • Einstein melawan mekanika Newtonian klasik.

Dalam semua kasus itu:

  • distribusi data sosial mendukung paradigma lama,
  • tetapi individu tertentu mempertahankan hipotesis minoritas.

LLM memang secara default:

  • memodelkan distribusi linguistik historis,
  • sehingga cenderung konservatif terhadap paradigma dominan.

Secara teknis, ini benar.

LLM dilatih untuk meminimalkan prediction error terhadap data masa lalu:

P(tokent+1context)P(token_{t+1} | context)

Artinya:

  • model belajar regularitas,
  • bukan “kebenaran metafisik”.

Tulisan Anda tepat ketika menyebut bahwa:

LLM tidak memiliki komitmen ontologis terhadap truth, hanya terhadap probabilistic coherence.

Ini kritik yang sangat fundamental.


2. Bagian yang terlalu absolut

Pernyataan seperti:

“LLM akan selalu berada di sisi sejarah yang salah”

atau

“LLM tidak mungkin menghasilkan pengetahuan baru”

secara ilmiah terlalu kuat.

Karena ada perbedaan penting antara:

  • menghasilkan hipotesis baru,
    vs
  • mempercayai hipotesis baru.

LLM sebenarnya sudah bisa:

  • menghasilkan kombinasi ide yang belum pernah muncul,
  • mengusulkan struktur protein,
  • menemukan kandidat material,
  • membantu conjecture matematika,
  • menghasilkan desain eksperimental.

Masalahnya:

  • mereka tidak “meyakini” hipotesis itu,
  • tidak memiliki intentionality,
  • tidak memiliki epistemic commitment.

Ini beda besar.


3. Masalah sentral: agency, bukan sekadar data

Kelemahan terbesar LLM bukan hanya “statistik”.

Tetapi:

LLM tidak punya:

  • kebutuhan biologis,
  • survival pressure,
  • embodied interaction,
  • tujuan intrinsik,
  • rasa ingin tahu otonom,
  • willingness to risk failure.

Galileo bersedia dipenjara.

Wright Brothers bersedia gagal berkali-kali secara fisik.

LLM:

  • tidak memiliki stake eksistensial terhadap kebenaran.

Ini jauh lebih penting daripada sekadar “dilatih pada data masa lalu”.


4. Counterargument penting terhadap tesis Anda

Tulisan Anda mengasumsikan bahwa manusia fundamentally non-statistical.

Padahal otak manusia juga:

  • massively predictive,
  • Bayesian,
  • pattern-driven,
  • trained by historical experience.

Banyak neuroscientist modern justru melihat otak sebagai prediction engine.

Contoh:
Predictive Processing

Masalahnya bukan:

  • manusia tidak statistik,
    tetapi:
  • manusia mampu memutus distribusi statistiknya sendiri.

Mengapa?

Karena manusia memiliki:

  • counterfactual imagination,
  • embodiment,
  • emotion,
  • drive,
  • social conflict,
  • causal world models,
  • experimentation loops.

Jadi perbedaannya mungkin bukan:
“statistik vs non-statistik”

melainkan:

passive statistical inference vs active world-intervention.

Ini jauh lebih presisi.


5. Galileo thought experiment: benar tetapi parsial

Klaim:

“LLM tahun 1633 pasti menolak heliosentrisme”

tidak sepenuhnya pasti.

Jika data training mengandung:

  • tulisan Copernicus,
  • Galileo,
  • Kepler,
  • anomali orbit planet,
  • problem epicycle Ptolemaic,

maka model mungkin menghasilkan:

“Ada teori minoritas yang lebih menjelaskan observasi tertentu.”

Karena LLM tidak hanya mereplikasi mayoritas,
tetapi juga:

  • memodelkan relasi konseptual,
  • konsistensi internal,
  • explanatory compression.

Model modern kadang mampu:

  • memilih teori minoritas jika lebih explanatory.

Namun:

  • probabilitas sosial tetap akan menekan output itu.

Jadi argumen Anda valid sebagai kecenderungan statistik,
tetapi tidak valid sebagai impossibility theorem.


6. Bagian paling kuat secara filosofis

Bagian terbaik tulisan ini sebenarnya implisit:

Pengetahuan baru sering lahir dari tindakan, bukan inferensi.

Ini sangat penting.

LLM:

  • tidak melakukan eksperimen nyata,
  • tidak menciptakan data melalui tindakan fisik,
  • hanya mengonsumsi representasi simbolik.

Sedangkan manusia:

  • menciptakan data baru melalui intervensi dunia.

Dalam filsafat sains:
ini dekat dengan:

  • pragmatisme,
  • active inference,
  • enactivism,
  • embodied cognition.

Makna:

epistemologi manusia bersifat world-coupled,
sementara LLM bersifat text-coupled.

Ini kritik yang jauh lebih kuat daripada sekadar “LLM statistik”.


7. Namun arah perkembangan AI mulai menyerang kelemahan ini

Tulisan Anda benar untuk:

  • pure LLM pasif.

Tetapi frontier AI sekarang bergerak ke:

  • agentic AI,
  • tool use,
  • robotic interaction,
  • autonomous experimentation,
  • reinforcement learning,
  • self-play,
  • synthetic data generation.

Contoh:

  • DeepMind AlphaGo menghasilkan langkah non-manusia.
  • AlphaFold menemukan struktur protein yang tidak diketahui.
  • AI material discovery mulai menghasilkan kandidat baru.

Pertanyaan besar:
Apakah itu “pengetahuan baru”?

Jawabannya:

  • sebagian ya secara operasional,
  • tetapi belum jelas secara ontologis.

Karena:
AI belum memiliki pemahaman fenomenologis terhadap apa yang ia temukan.


8. Klaim “LLM tidak bisa salah ke arah yang benar”

Ini hampir benar, tetapi perlu nuansa.

Dalam training standar:

  • model memang dihukum karena deviasi distribusional.

Tetapi pada inference:

  • sampling stochastic dapat menghasilkan novelty.

Masalahnya:
LLM tidak punya mekanisme internal untuk:

  • mempertahankan hipotesis aneh,
  • menginvestasikan sumber daya,
  • melakukan eksperimen jangka panjang,
  • melawan tekanan sosial.

Manusia bisa obsesif terhadap ide minoritas selama puluhan tahun.

LLM tidak memiliki persistence of conviction.

Ini poin yang lebih kuat daripada sekadar “tidak kreatif”.


9. Secara akademik, tulisan ini akan lebih kuat jika:

A. Mengurangi absolutisme

Hindari:

  • “mustahil”
  • “tidak akan pernah”
  • “selalu”

Ganti dengan:

  • “secara arsitektural cenderung”
  • “dalam paradigma current-generation LLM”
  • “tanpa agency embodied”

B. Menambahkan kerangka teoritis

Tulisan ini akan jauh lebih kuat jika mengaitkan:

  • Karl Popper,
  • Thomas Kuhn,
  • Bayesian cognition,
  • Active Inference,
  • Embodied Cognition,
  • Symbol Grounding Problem.

C. Memisahkan:

  • novelty,
  • creativity,
  • discovery,
  • truth,
  • belief,
  • agency.

Saat ini semuanya masih tercampur.


10. Kesimpulan paling presisi

Versi yang lebih kuat secara ilmiah mungkin:

LLM unggul dalam eksplorasi ruang pengetahuan yang sudah direpresentasikan dalam distribusi data, tetapi lemah dalam menghasilkan komitmen epistemik terhadap hipotesis kontradiktif yang belum memiliki dukungan empiris memadai. Keterbatasan ini terutama berasal dari sifat pasif, non-embodied, dan non-agentic dari arsitektur current-generation LLM.

Itu lebih defensible dibanding:

“AI tidak akan pernah bisa menghasilkan pengetahuan baru.”

Karena sejarah AI menunjukkan banyak “kemustahilan” akhirnya runtuh.

Tetapi kritik inti Anda tetap sangat valid:

probabilistic imitation bukanlah hal yang sama dengan epistemic courage.

Comments

Popular posts from this blog

Prompt untuk Menghasilkan Style Gambar Tertentu

8 Prompt Generator Gambar Gemini

Simulasi Emosi: Paradigma Baru dalam Intepretabilitas dan Etika Kecerdasan Buatan