Biaya Inferensi dan Regulasi Tanpa Sanksi

Ada ironi struktural yang terlalu sempurna bahkan untuk standar distopia ringan: angka PHK di industri teknologi global tahun 2026 telah melampaui 150.000 posisi — hampir setengahnya secara eksplisit diatribusikan pada efficiency optimization berbasis kecerdasan buatan — sementara di saat bersamaan, perusahaan-perusahaan yang sama menggelontorkan dana gabungan mendekati $700 miliar untuk pembangunan infrastruktur inferensi. Dalam istilah infrastruktur, ini adalah skenario di mana satu komponen sistem mengalami overprovisioning brutal sementara komponen lainnya menjalani deprovisioning permanen — dan keduanya diputuskan oleh scheduler yang sama.

Arsitektur PHK Massal

Data dari Q1 2026 menunjukkan pola konsisten di semua layer. Meta, Amazon, Oracle, PayPal, Block, Coinbase — perusahaan dengan laporan keuangan sehat, margin operasional positif, dan kapitalisasi pasar stabil — serempak menjalankan headcount reduction dalam skala yang sebelumnya hanya terlihat pada masa krisis 2022-2023. Perbedaannya: perusahaan-perusahaan ini tidak sedang merugi. Mereka menguntungkan, dan keputusan pemotongan bukanlah respons terhadap cash flow negatif, melainkan realokasi strategis dari human capital expenditure menuju compute capital expenditure.

Block memangkas 40% tenaga kerja. Oracle diperkirakan melepas sekitar 30.000 karyawan. PayPal 20%. LinkedIn, Wix, Webflow — nama-nama bergantian di tech layoff tracker sepanjang kuartal. The State of Brand melaporkan bahwa narasi dominan di earnings call adalah “AI-driven efficiency” — sebuah frasa yang secara teknis berarti: headcount yang sebelumnya menjalankan fungsi tertentu kini digantikan oleh inference pipeline yang menjalankan fungsi yang sama dengan marginal cost yang lebih rendah.

Dalam arsitektur sistem, ini adalah keputusan resource allocation yang aneh secara topologis: mengganti general-purpose compute nodes yang bisa menulis kode, meninjau desain, merespons incident, dan beradaptasi dengan konteks tidak terstruktur — dengan specialized inference accelerators yang hanya bisa melakukan satu jenis operasi matematis dalam volume besar. Separation of concerns yang idealnya menjadi prinsip baik dalam system design di sini diterapkan secara destruktif: satu jenis compute diekspansi, jenis lainnya dimatikan.

Ekonomi Unit Inferensi

Terdapat perhitungan sederhana yang jarang diartikulasikan secara eksplisit dalam quarterly report namun menjadi variabel laten di setiap keputusan workforce reduction: satu tahun gaji insinyur mid-level — sekitar $150.000 hingga$ 250.000 tergantung yurisdiksi — setara dengan harga satu unit H100 atau B200 di pasar enterprise. Perbedaannya: GPU beroperasi 24/7 tanpa sick leave, vesting schedule, atau mental health day. Forbes melaporkan bahwa cost per token inferensi telah turun di bawah ambang ekonomis yang membuat tenaga manusia tetap viable untuk tugas-tugas tertentu.

Dari lokalitas terbatas, absurditasnya berlapis: di ekosistem startup Indonesia yang sebagian besar masih berjuang mencapai product-market fit, kita menyaksikan adopsi playbook yang sama — PHK kecil-kecilan dibungkus narasi “efisiensi operasional berbasis AI” — tanpa memiliki skala infrastruktur yang membuat perhitungan itu masuk akal. Unit economics di ruang operasional dengan total addressable market lebih sempit membuat ROI penggantian manusia dengan inferensi jauh lebih sulit dijustifikasi. Namun bandwagon effect bersifat contagious: ketika Big Tech melakukannya, startup mengikuti tanpa due diligence yang memadai.

Regulasi sebagai Middleware Tanpa Logika Penapis

Pada Maret 2026, Sekjen Kemenkomdigi mengumumkan rencana pemerintah Indonesia untuk memperkenalkan Peraturan Presiden tentang Kecerdasan Artifisial. Poin penting yang luput dari sebagian besar pemberitaan: regulasi ini tidak memuat sanksi. Sebuah kerangka tata kelola yang mendefinisikan prinsip etika, transparansi, dan akuntabilitas — namun tanpa mekanisme penegakan yang membuat prinsip-prinsip tersebut operasional.

Dalam istilah infrastruktur, ini adalah middleware yang dideklarasikan dalam configuration file namun tidak di-load ke dalam request pipeline. Semua request tetap lolos, semua response tetap dikirim, tidak ada validation layer yang memfilter payload berbahaya. Regulasi tanpa sanksi adalah rate limiter tanpa batas, authentication middleware yang me-pass semua kredensial, input sanitizer yang mengembalikan input apa adanya. Ia hadir secara struktural — ada di stack — namun tidak mengubah behavior sistem sama sekali.

Risiko-risiko yang diidentifikasi Perpres — misinformasi dan deepfake, bias algoritmik, privasi data, kerentanan siber — semuanya benar. Tidak ada yang dilengkapi actionable remediation. Ketika risiko didokumentasikan tanpa protokol mitigasi terukur, yang kita miliki bukanlah risk management framework — melainkan risk acknowledgment form yang ditandatangani lalu disimpan di laci. Dalam security engineering, ini setara dengan memasang CCTV yang tidak terhubung ke recording server.

Cascading Failure Dua Arah

Kita berada dalam situasi di mana dua fenomena terjadi secara paralel dan saling memperkuat. Di tingkat global, Big Tech mempercepat deprovisioning tenaga kerja untuk mendanai overprovisioning infrastruktur inferensi — keputusan rasional secara mikro namun berpotensi systemically fragile secara makro. Di tingkat nasional, regulator menyusun kerangka etika yang secara struktural tidak bisa menegakkan apa pun — keputusan rasional secara politis namun berpotensi legally inconsequential secara praktis.

Keduanya adalah bentuk asymmetric scaling yang sama: sumber daya dialokasikan ke satu bagian stack sementara bagian lain dibiarkan mengalami resource starvation. Jika inference cost suatu saat naik — karena geopolitik, kelangkaan rare earth, atau regulasi energi yang membatasi operasi data center — perusahaan yang telah mengganti 40% tenaga kerja dengan GPU akan menghadapi capacity crunch yang tidak bisa diatasi dengan menekan tombol “hire back”. Proses onboarding manusia jauh lebih lambat daripada provisioning GPU virtual. Demikian pula, jika regulasi AI di Indonesia suatu saat mendapatkan sanksi — melalui amandemen atau tekanan publik — perusahaan yang saat ini beroperasi tanpa compliance overhead akan mengalami technical debt regulasi yang akumulasinya sudah mencapai tingkat critical mass.

Log berakhir di sini. Stack trace menunjukkan alokasi sumber daya yang tidak seimbang di kedua lapisan — perusahaan dan negara — dan belum ada mekanisme rollback yang terdefinisi untuk keduanya. Server tetap menyala, namun distribusi beban di antara compute nodes semakin mencerminkan keputusan yang lebih didasari fashion industri daripada capacity planning.