AI Literacy Itu Bukan Soal Jago Prompting

Banyak orang mengira mereka sedang belajar AI. Padahal Baru Belajar Cara Menggunakannya.

Prompting itu belajar interface. AI literacy itu belajar geometri, probabilitas, dan cara mesin ini bisa salah tanpa terasa salah.

Saya mulai karier dari bahasa assembler.

Bukan mau bilang saya senior. Itu cuma kenyataan zaman itu, hehehe.

Kalau saya mau program jalan, saya harus tahu isi register, alamat memori, dan bagaimana CPU memindahkan data dari satu kotak ke kotak lain. Tidak ada framework yang menyembunyikan kerumitan.

Kalau ada error, saya tidak bisa lempar tanggung jawab ke “library-nya yang bug”. Saya harus turun sampai level di mana mesin itu benar-benar berpikir.

Kebiasaan itu yang kebawa sampai sekarang. Setiap kali ada teknologi baru yang ramai dibahas, saya selalu tanya satu hal ke diri sendiri, “Orang-orang ini paham mesinnya, atau cuma hafal tombolnya?”.

Untuk AI generatif hari ini, jawabannya (buat sebagian besar orang) adalah yang kedua. Dan itu sesuatu (mungkin masalah) yang tidak banyak disadari.

Itulah yang sebenarnya disebut AI literacy, dan ironisnya, justru yang paling sedikit dipelajari orang.

Prompt Engineering vs AI Literacy

Coba perhatikan. Hampir semua orang sekarang bilang, “saya sedang belajar AI”.
Tapi kalau ditelusuri lebih dalam, yang dipelajari biasanya cuma satu hal: cara merangkai kata (bisa dibaca: prompting) supaya ChatGPT atau Claude memberi jawaban yang lebih bagus.

Itu bukan belajar AI. Itu seperti belajar googling yang lebih canggih dikit.

Kalau “pelajaran AI” kamu isinya cuma hafal template prompt, atau eksperimen kalimat sampai ketemu formula ajaib biar ChatGPT mau nulis kode dengan rapi, kamu sedang belajar antarmuka, bukan mesinnya.

Sama seperti orang yang hafal cara mencet tombol di vending machine minuman kalengan. Dia tahu tombol mana yang harus dipencet supaya kaleng minuman itu jatuh. Tapi dia tidak tahu (dan tidak butuh tahu) bagaimana mesin itu membaca koin, menghitung saldo, lalu mendorong kaleng itu ke lubang keluar.

Fine-tuning model dari file JSON yang kamu unduh dari Hugging Face juga belum tentu lebih baik. Itu masih level “tahu cara isi ulang mesinnya”, bukan “tahu cara mesin itu bekerja”.

AI literacy yang sebenarnya menuntut pergeseran cara pandang yang agak “berat”. Komputer kita masih melakukan hitungan matematika seperti dulu. Bedanya, sekarang hitungan itu sedang menggambar bentuk geometri.

Cara Kerja AI Generatif Yang Seharusnya Kamu Tahu

Di Mana Sebenarnya Pengetahuan Itu Disimpan?

Ini bagian yang membedakan orang yang “pakai AI” dengan orang yang “ngerti AI”.

Model AI tidak “tahu” fakta. Dia menavigasi probabilitas di dalam ruang representasi berdimensi tinggi.

Waktu kamu tanya, “Siapa presiden Zimbabwe?”, model itu tidak membuka tabel database. Tidak mengecek knowledge graph. Tidak punya memori seperti manusia yang menyimpan kenangan di laci otak. Yang dia lakukan adalah menghitung sebuah lintasan (trajectory) dari titik awal pertanyaanmu menuju titik di mana jawaban “secara statistik paling mungkin” berada.

Coba bayangkan pasar tradisional.
Lapak sayur selalu deretan dengan lapak buah. Lapak bumbu dapur ada di sekitarnya. Tapi lapak sparepart motor? Jauh, biasanya di pinggir, dekat terminal. Bukan kebetulan. Pedagang menempatkan barang berdasarkan kedekatan makna. Barang yang sering dicari bareng, ditaruh berdekatan.

Begitu juga di dalam model AI.

Setiap kata, gambar, dan konsep diubah jadi sederet angka yang disebut vector atau embedding. “Anjing” punya koordinat tertentu. “Anak anjing” letaknya sangat dekat dengan “Anjing” itu wajar, maknanya berdekatan. Sementara “Karburator” ada jauh sekali, di sudut lain peta.

Bedanya, peta pasar cuma punya dua arah: kiri-kanan dan depan-belakang, kadang ditambahi atas-bawah kalau pasarnya tingkat. Peta di dalam model AI punya 1.536 arah sekaligus, bahkan lebih, tergantung modelnya.

Otak manusia tidak dirancang untuk membayangkan ruang sebanyak itu. Tapi mesin tidak butuh membayangkan. Dia cuma butuh menghitung.

Pengetahuan yang saya maksud, dengan kata lain, adalah geometri.

Ketika model memberi jawaban benar, dia tidak “mengingat” jawaban itu. Dia berhasil menyusuri manifold (bentuk melengkung dari distribusi data) sampai mendarat di koordinat tempat jawaban itu, secara probabilistik, yang memang seharusnya berada.

Halusinasi Itu Bukan Mesinnya Lagi Error

Sekarang kita masuk ke bagian yang sering disalahpahami: halusinasi.

Kata “halusinasi” itu sendiri sudah menyesatkan. Model tidak berbohong. Dia tidak bingung. Dia cuma melakukan perjalanan ke sebuah koordinat yang (berdasarkan arah dari prompt kamu) terasa benar secara matematika. Masalahnya, koordinat itu kebetulan kosong di dunia nyata.

Dia tidak mendarat di pusat kota “Kebenaran”. Dia mendarat di pinggiran kota, di kompleks perumahan baru yang belum punya nama jalan resmi, tapi dari kejauhan kelihatan mirip pusat kota.

Ini yang membuat model bisa terdengar sangat percaya diri sambil salah total.

Tingkat “keyakinan” dalam LLM cuma ukuran seberapa tajam kurva probabilitasnya. Model bisa 99,9% yakin secara matematis bahwa dia di jalur yang benar, sementara 100% salah secara fakta.

Bayangkan sopir taksi online yang GPS-nya menunjuk arah dengan sangat tegas “belok kanan, 200 meter” , padahal sinyalnya memantul dari gedung dan sebenarnya mengarahkan ke jalan buntu. Sopirnya tidak ragu sedikit pun. Dia tancap gas 100 km/jam ke arah yang salah, dengan penuh percaya diri.

Itulah model AI ketika berhalusinasi. Hitungannya jalan mulus. Arahnya yang keliru.

Kenapa Menambah Data ke Prompt Tidak Memperbaiki Jawaban AI

Banyak yang berpikir: kalau model salah, ya tinggal kasih lebih banyak konteks di prompt, beres.

Tidak semudah itu, mas Bambang.

Kamu tidak bisa mengubah arah aliran sungai cuma dengan menuang satu galon air tambahan di tengah jalan. Arah arusnya sudah terbentuk dari hulu, dari bobot (weights) yang dilatih bertahun-tahun, dengan data sebanyak itu.
Kalau dalam peta internal model, “A” sudah terlanjur dekat dengan “B”, tidak ada jumlah konteks di jendela percakapanmu yang bisa membentuk ulang geometri itu saat inferensi berjalan.

Kamu sedang melawan gravitasi dari hasil pelatihan model. Dan gravitasi tidak peduli seberapa rapi prompt-mu disusun.

Prompt Engineer vs AI Thinker

Tukang Ojek vs Insinyur

Kalau kamu mau tetap relevan dua tahun ke depan, kamu harus pindah posisi: dari pengguna jadi pemikir.

Bedanya begini.
Seorang Tool User mengecek jawaban AI dengan cara membaca, “oh, kelihatannya benar”. Seorang AI Thinker mengukur jawaban itu dengan kompas, berapa derajat sudutnya dari kebenaran.

Tukang ojek yang hebat hafal seluruh gang di satu kecamatan. Tapi kalau ada jalan baru dibuka, atau ada gang yang ditutup karena proyek, dia bisa jadi harus belajar ulang dari nol.
Insinyur yang membuat peta kota tidak perlu menghafal setiap gang. Dia paham logika bagaimana jalan-jalan itu terbentuk, terhubung, dan berubah. Ketika ada perubahan, dia tahu ke mana harus melihat.

“Prompt engineer” hari ini banyak yang seperti tukang ojek tadi. Hafal “mantra”, hafal urutan kalimat ajaib. Begitu arsitektur model berganti (dan itu pasti terjadi) atau layer abstraksinya bergeser, hafalan itu jadi sampah dalam semalam.

Cosine Similarity

Cara Mengukur Makna Jawaban AI, Bukan Menebak Kata

Ini bagian yang paling sering dilewatkan orang yang cuma belajar tombol.

Kalau kamu membangun sistem RAG (model yang menjawab berdasarkan dokumen referensi), pertanyaan paling penting bukan “jawabannya kedengaran bagus nggak”. Pertanyaannya. “Apakah model benar-benar memakai konteks yang kamu kasih, atau dia mengarang sambil lalu?”.

Cara mengukurnya bukan dengan membaca jawabannya satu-satu, itu cara kerja Tool User. Cara AI Thinker adalah mengukur sudut antara vektor konteks dan vektor jawaban. Konsepnya disebut cosine similarity, kemiripan arah dua garis, diukur dari sudutnya, bukan dari kata-katanya.

# ilustrasi sederhana
import numpy as np
from typing import Dict

# Simulasi pengambilan vektor dari model embedding (mis. text-embedding-3-large)
def get_embedding(text: str) -> np.array:
    # Di produksi, ini memanggil API atau model ONNX lokal
    # Di sini cuma vektor acak untuk demonstrasi
    return np.random.rand(1536)

def cosine_similarity(v1: np.array, v2: np.array) -> float:
    """
    Menghitung cosinus sudut antara dua vektor.
    1.0 = arah sama persis (makna identik)
    0.0 = tegak lurus (tidak berhubungan)
    -1.0 = arah berlawanan
    """
    dot_product = np.dot(v1, v2)
    norm_v1 = np.linalg.norm(v1)
    norm_v2 = np.linalg.norm(v2)
    return dot_product / (norm_v1 * norm_v2)

def evaluate_hallucination_risk(
    context_text: str,
    generated_answer: str,
    threshold: float = 0.75
) -> Dict:
    """
    Menentukan apakah jawaban benar-benar berpijak pada konteks.
    """
    context_vector = get_embedding(context_text)
    answer_vector = get_embedding(generated_answer)

    score = cosine_similarity(context_vector, answer_vector)

    # Kalau sudutnya terlalu lebar, model sudah melenceng dari konteks
    is_risky = score < threshold

    return {
        "similarity_score": round(score, 4),
        "risk_detected": is_risky,
        "reasoning": "Jawaban melenceng terlalu jauh dari konteks." if is_risky else "Jawaban berpijak pada konteks."
    }

# Contoh pemakaian
context = "Batas rate limit API adalah 500 request per menit."
response = "Kamu bisa melakukan 500 panggilan setiap 60 detik."  # secara makna identik

# Walau kata-katanya berbeda, vektornya menunjuk ke arah yang sama
eval_result = evaluate_hallucination_risk(context, response)
print(eval_result)

Inilah arti “belajar AI” yang sebenarnya.
Bukan belajar menulis “tolong bertindak sebagai senior developer”. Tapi belajar memverifikasi secara matematis apakah vektor keluaran sejajar dengan vektor kebenaran yang kamu pegang.

Saya tidak ngomong ini dari teori semata.
Salah satu produk yang sedang saya kembangkan punya komponen yang disebut Alignment Guard, sebuah pagar yang baru boleh dibuka ke produksi setelah minimal 300 contoh kasus terindeks di database vektor. Bukan formalitas administratif. Itu garda terakhir supaya AI yang berhadapan langsung dengan pengguna, dia tidak mengarang jawaban yang kedengarannya masuk akal tapi sebenarnya kosong.

Cara Belajar AI yang Seharusnya

3 Skill Wajib Selain Prompting

Kalau kamu mau berada di depan di tahun-tahun berikutnya, berhenti menonton video “roadmap belajar AI 2030”. Mulai lakukan tiga hal ini.

Pertama, pelajari mode kegagalannya.
Jangan cuma lihat saat model benar. Coba dengan sengaja membuatnya rusak. Cari “tepi manifold” — input-input yang membuat model kolaps jadi pengulangan kata atau jawaban tidak masuk akal sama sekali. Di situ kamu belajar batas sebenarnya dari sistem yang kamu pakai.

Kedua, pelajari evals.
Ini kerjaan yang membosankan, tapi paling menghasilkan. Bisa nggak kamu menulis skrip yang otomatis menilai seribu keluaran model? Kalau tidak, jangan harap bisa men-scale produk berbasis AI. Ini sama seperti dapur warung yang besar — kalau koki cuma masak satu-satu sambil dicicipi sendiri, dapur itu tidak akan pernah bisa melayani seratus meja sekaligus. Harus ada sistem pengecekan rasa yang berjalan sendiri, bukan tergantung lidah satu orang.

Ketiga, berpikir dalam sistem.
Model itu cuma satu komponen di lini produksi. Keajaiban sebenarnya ada di router yang menentukan permintaan harus diarahkan ke mana, memory layer yang menyimpan konteks antar sesi, dan verifier yang mengecek hasil sebelum sampai ke pengguna. Orang yang cuma fokus ke model itu seperti orang yang menilai sebuah restoran cuma dari kompornya, padahal yang menentukan rasa akhir adalah seluruh dapur, mulai dari belanja bahan sampai cara penyajian.

Risiko Tersembunyi AI

Silent Failure yang Sering Diabaikan

Ini risiko AI yang paling sering diabaikan: bug-nya tidak akan membuat server down. Tidak akan muncul pesan error merah menyala di terminal.

Dia akan diam-diam saja. Seperti orang yang kelihatan baik-baik di permukaan, tapi menyimpan sesuatu yang tidak pernah disampaikan, tidak ada tanda di luar, sampai suatu hari semuanya pecah sekaligus.

Sebuah ringkasan dokumen hukum yang diam-diam menukar kata “tergugat” jadi “penggugat”, karena di ruang vektor, dua kata itu letaknya hampir bertumpukan.

Sebuah chatbot kesehatan yang menyarankan dosis obat yang secara statistik sangat mungkin muncul dalam data pelatihannya, tapi secara biologis bisa membunuh orang yang meminumnya.

Kebanyakan orang tidak tertinggal karena mulai terlambat. Mereka tertinggal karena belajar abstraksi yang salah.

AI literacy bukan soal tahu apa yang harus diketik di kotak chat. Itu soal tahu, dengan pasti, kapan kamu tidak boleh percaya begitu saja pada apa yang keluar dari kotak itu.

Dan yang paling membuat saya was-was: orang yang membangun sistem itu sering tidak akan tahu ada yang salah, sampai ada yang benar-benar celaka karenanya. Karena dari awal, dia memang tidak pernah belajar cara membaca arah kompasnya sendiri.

Takeaway

AI Literacy Dimulai dari Memahami, Bukan Menghafal

Prompt Engineering Itu Pintu Masuk, Bukan Tujuan Akhir

Saya juga tidak mau kedengaran seperti orang yang baru turun gunung, lalu nyinyirin semua orang yang masih di kaki bukit.

Jadi prompt engineer itu tidak salah. Sama sekali tidak. Itu pintu masuk paling masuk akal buat hampir semua orang yang baru kenal AI (termasuk saya), waktu pertama kali coba-coba AI, ya mulainya dari situ juga: ngetik, lihat hasil, ngetik ulang.

Tapi ada bedanya antara “mulai dari sana” dengan “berhenti di sana”.

Tukang ojek yang hafal seluruh gang kampung itu berguna, kota butuh dia. Masalahnya muncul kalau dia menganggap hafalan itu sudah final, padahal bulan depan proyek tol baru dibuka, dan separuh gang yang dia hafal bakal ditutup permanen.

Prompt yang hari ini kelihatan ajaib bisa basi begitu model versi baru rilis dengan cara “berpikir” yang berbeda. Kalau seluruh fondasi kariermu cuma hafalan kalimat, kamu sedang membangun rumah di atas tanah yang terus digusur.

Jadi silakan mulai dari prompting. Anggap itu pintu masuk. Bukan rumahnya.

Satu hal lagi, dan ini yang paling jujur ingin saya katakan.

Kalau kamu masih bertahan sampai sejauh ini, lewat bagian vektor, lewat kode cosine similarity, lewat analogi ojek dan GPS yang nyasar, itu sendiri sudah jadi sinyal. Kebanyakan orang berhenti di judul yang bikin penasaran, atau paling jauh di tiga paragraf pertama yang masih ada drama-nya. Begitu masuk ke bagian yang butuh mikir, mereka pindah tab.

Kamu yang masih di sini punya satu hal yang sekarang langka: kesabaran untuk masuk ke sesuatu yang tidak instan. Dan itu modal paling besar di dunia AI hari ini, karena arus besarnya justru lari ke arah sebaliknya. Semua orang berebut jalan pintas, berebut prompt paling sakti, berebut cara biar “kelihatan” paham AI dalam waktu secepat mungkin.

Dulu saya butuh waktu lama untuk paham register dan alamat memori sebelum bisa menulis program yang jalan dengan benar. Lambat? Iya. Tapi begitu paham itu, setiap bahasa dan framework yang muncul setelahnya jadi lebih mudah dibaca, karena saya tahu apa yang sebenarnya terjadi di bawahnya.

Modal yang kamu kumpulkan dari membaca sampai sini juga begitu.

Hasilnya tidak kelihatan minggu depan. Tapi nanti, waktu yang lain masih sibuk berburu mantra prompt generasi terbaru, kamu sudah bisa membaca arah anginnya dari jauh. Dan itu yang membedakan siapa yang bertahan, dan siapa yang harus mulai dari nol lagi, sambil bertanya-tanya kenapa angin ini terasa familiar.

Terima kasih sudah membaca. Semoga bermanfaat.

Catatan Kaki

Fine-tuning — proses melatih ulang sebagian model AI yang sudah ada dengan data tambahan, supaya gaya jawaban atau pengetahuannya lebih sesuai kebutuhan tertentu.
Knowledge graph — basis data yang menyimpan fakta dalam bentuk hubungan eksplisit antar entitas (misalnya “Jakarta — ibu kota — Indonesia”). Beda dengan AI generatif yang bekerja lewat probabilitas, bukan pencarian fakta langsung.
Vector / embedding — representasi sebuah kata, gambar, atau konsep dalam bentuk sederet angka. Angka-angka ini menentukan “posisi” makna sesuatu di peta raksasa yang dipakai AI untuk berpikir.
Manifold — bentuk permukaan tempat seluruh data pelatihan AI tersebar di dalam ruang vektor. AI “menyusuri” bentuk ini untuk mencari jawaban yang paling mungkin.
LLM (Large Language Model) — model AI berskala besar yang dilatih dari teks dalam jumlah masif, seperti ChatGPT atau Claude.
Bobot (weights) — angka-angka di dalam model yang menyimpan hasil pembelajaran dari data pelatihan. Inilah yang menentukan bagaimana AI memetakan makna.
Context window (jendela konteks) — jumlah maksimum teks, termasuk prompt, riwayat chat, dan dokumen lampiran, yang bisa “dilihat” AI sekaligus dalam satu interaksi.
Inferensi — proses AI menghasilkan jawaban dari prompt yang kamu kirim, berbeda dari proses “pelatihan” yang membentuk model sebelumnya.
Layer abstraksi (abstraction layer) — lapisan perangkat lunak yang menyembunyikan kerumitan di baliknya, supaya pengguna cukup berinteraksi dengan versi yang lebih sederhana. Contoh: API atau library yang membungkus cara kerja model AI sebenarnya.
RAG (Retrieval-Augmented Generation) — teknik di mana AI mencari potongan dokumen relevan terlebih dahulu, lalu menyusun jawaban berdasarkan potongan itu, supaya jawabannya berpijak pada sumber, bukan cuma dari memori model.
Cosine similarity — cara mengukur seberapa “searah” makna dua teks, dengan membandingkan sudut antara dua vektornya. Nilainya 0-1: makin mendekati 1, makin sama maknanya, walau kata-katanya berbeda.
Database vektor (vector database) — jenis basis data yang dirancang khusus untuk menyimpan dan mencari embedding berdasarkan kemiripan makna, bukan pencocokan kata persis.
Evals (evaluations) — skrip otomatis yang menguji ratusan atau ribuan jawaban AI sekaligus, lalu memberi skor apakah jawaban itu benar, relevan, aman, atau melenceng.
Router, memory layer, verifier — tiga komponen umum di sekitar model AI dalam sebuah sistem. Router menentukan permintaan diarahkan ke model atau alat mana; memory layer menyimpan konteks dari sesi-sesi sebelumnya; verifier mengecek hasil AI sebelum ditampilkan ke pengguna.

AI Literacy Itu Bukan Soal Jago Prompting — Begini Bedanya

Prompt Engineering vs AI Literacy

Cara Kerja AI Generatif Yang Seharusnya Kamu Tahu