Approval gate bukan bottleneck — itu insurance terhadap halusinasi
Saya tidak setuju klaim approval gate jadi manual bottleneck. Cost approval 30-60 detik vs cost halusinasi bocor ke channel klien — pilih satu.
Approval gate bukan bottleneck — itu insurance terhadap halusinasi
Opini · Kristian · Partner & Lead Business Analyst, Capital Commerce Consulting
Setiap kali saya pitch pattern 3-layer governance ke klien (agent thinks + human approves + n8n executes), satu komentar konsisten muncul: "Tapi ini bottleneck — manusia jadi gating factor. AI yang harusnya speed up workflow malah lambat karena perlu approval."
Saya tidak setuju. Approval gate bukan bottleneck. Approval gate adalah insurance.
Pattern yang saya lihat di klien past
Selama 2024-2026 saya engage dengan beberapa klien yang masuk 75% bucket Forrester (in-house AI agent build gagal mencapai production-stable). Pattern failure paling sering:
- Agent dapat tool produksi langsung. Bisa kirim email, post ke channel, update database — tanpa approval intermediate.
- Demo lancar di staging. Tim teknis confident pattern jalan.
- Deploy ke production. Hari pertama OK.
- Hari ke-7 sampai hari ke-30: halusinasi muncul. Output yang seharusnya draft notification jadi customer email langsung. Agent mengirim message ke channel klien yang konteksnya wrong. Database update yang tidak reversible berdasarkan reasoning yang salah.
- Trust internal rusak. Tim sales / customer success / management lose confidence. AI dianggap "tidak siap untuk production".
Itu bukan AI yang tidak siap. Itu pattern governance yang skip approval gate.
Argumen "approval gate = bottleneck" tidak hold
Saya pernah hitung cost concrete untuk klien yang protest approval gate latency:
Cost approval gate per turn:
- Operator review reasoning + proposed action = 30-60 detik average
- 100 inbound lead per hari = total review time 50-100 menit per hari
- 1 sales rep cukup untuk handle review queue 100 lead/hari (sambil tetap kerja close-deal di sisa waktu)
Cost halusinasi yang bocor ke klien:
- 1 customer email yang salah = potentially 1-2 jam staff time untuk damage control + apology + clarification
- Trust hit yang tidak terukur konkret tapi compound — klien yang lose confidence tidak pernah balik ke tier sebelumnya
- Brand damage cumulative — recovery butuh bulan, bukan minggu
Math-nya jelas. Cost approval gate = bounded + predictable. Cost halusinasi bocor = unbounded + asymmetric downside.
Asuransi seperti ini di domain finance, insurance, bahkan keamanan IT enterprise sudah pattern lama: transactional protection di-pay up-front untuk avoid catastrophic loss yang asymmetric. Approval gate di AI workflow adalah aplikasi pattern yang sama.
Kapan approval gate fair untuk skip
Saya tidak ideologis tentang ini. Ada konteks yang skip approval gate masuk akal:
1. Risk-bounded action dengan rollback feasible. Internal Slack message ke channel internal tim saja (bukan klien channel). Database update yang reversible (soft delete dengan audit log). Email draft yang masuk Outbox tanpa auto-send.
2. Confidence-threshold auto-approve untuk volume tinggi. Kalau model confidence > X% (calibrated dari training data), auto-approve. Below threshold, escalate ke human gate. Pattern ini work untuk volume >1000 turn/hari di mana full human gate tidak feasible.
3. Pre-approved template + parameter substitution. Output yang mengikuti template yang sudah di-validate sebelumnya, dengan parameter yang dari structured input. Tidak generate free-form text.
Tiga konteks di atas = approval gate masuk akal di-relax. Tapi default-nya tetap approval-on, bukan approval-off.
Apa yang saya lihat di pitch vendor "AI-first"
Vendor AI yang push autonomous agent narrative biasanya skip approval gate dari pitch deck. Sales-pitch line: "AI agent yang autonomous, end-to-end, no human in the loop, scale tanpa friction."
Saya pernah duduk di ruang pitch dengan vendor seperti ini. Demo lancar — staging environment, controlled input, predictable output. Saat saya tanya: "Apa yang terjadi kalau model halusinasi di production? Apa rollback path?" — jawaban biasanya generic: "Model akurasi > 99%, halusinasi rare event."
99% accuracy di volume 1000 turn/hari = 10 halusinasi per hari. 10 customer email yang salah per hari = catastrophic untuk klien manapun. "Rare event" framing tidak hold ketika scale + asymmetric downside di-akui jujur.
Pattern yang saya pakai sendiri
Di operasional Capital Commerce internal, saya operate stack dengan 3-layer governance:
- AI agent generate proposed action + reasoning (Anthropic Claude via LiteLLM)
- Saya review approval queue di Telegram bot (target review <2 menit per item)
- n8n execute post-approval
Latency total: 30 detik - 2 menit per turn untuk task yang impact klien atau public output. Untuk internal-only output (e.g. internal status update, log entry), saya skip approval gate.
Pattern ini saya pakai untuk content generation (SMG / IG carousel), email outbound (sales follow-up), proposal draft, documentation update. Total volume ~100-200 turn/minggu. Approval gate cost saya ~3-5 jam/minggu cumulative — minor compared dengan cost halusinasi bocor yang bisa terjadi kalau skip.
Counter-argument yang saya terima
"Tapi klien customer expect real-time response. Approval gate latency tidak fit."
Fair point — customer-facing real-time chat (sub-second response requirement) memang tidak fit pattern ini. Solusi: tier-1 AI auto-response untuk FAQ / informational query, tier-2 human gate untuk transactional / sensitive query. Bukan abandon approval gate, tapi tier per-decision risk level.
"Approval gate butuh staff full-time review queue, mahal."
Math: 100-200 turn/hari * 30-60 detik = 50-200 menit cumulative review per day. 1 staff bisa handle 5-10x volume ini sambil kerja paralel task lain. Tidak full-time review-only role. Cost 1 staff Rp 8-15 juta/bulan, dibandingkan cost catastrophic halusinasi bocor — math jelas.
"Pattern autonomous lebih impressive sebagai capability demo."
Saya tidak care impressive. Saya care production-stable. Demo yang impressive di staging tapi gagal di production = 75% bucket Forrester.
Penutup
Approval gate cost 30-60 detik per turn. Cost halusinasi bocor = trust klien hancur, recovery butuh bulan, brand damage cumulative.
Saya pilih approval gate. Setiap engagement Capital Commerce, saya rekomendasikan approval gate sebagai default. Klien yang protest, saya jelaskan math di atas. Klien yang masih protest setelah math = profile yang tidak fit dengan pattern kami; saya rekomendasikan vendor lain yang push autonomous narrative.
Bukan ideological. Practical.
Tag internal: Pillar 1 · Human-approved · Opinion · S1+S3
Author byline: Kristian (Partner & Lead Business Analyst)
Cross-reference: /pattern · /services/ai-operating-system · sample post 75% in-house build gagal — pattern apa yang bekerja
