Litecoin

Claude Code adalah 20 kali menguap oleh ruang kosong, dan pejabat mengatakan, "Simpan itu"

2026/04/04 02:29
👤ODAILY
🌐id

Claude Kode cache semua catatan Bug

Claude Code adalah 20 kali menguap oleh ruang kosong, dan pejabat mengatakan, "Simpan itu"

4-17 persen. Ini adalah tingkat bacaan Claude Code untuk bulan lalu. Tingkat normal adalah 97- 99%。

Ini berarti bahwa ketika Anda kembali ke sesi sebelumnya, Claude Code tidak kembali ke konteks yang telah diproses sebelumnya, tetapi berurusan dengan seluruh isi dari atas setiap kali dan mengkonsumsi antara 10 dan 20 kali jumlah normal. Anda pikir Anda melanjutkan percakapan, dan Anda benar-benar memulai yang baru seluruh waktu。

Angka ini didasarkan pada proxy surveilans oleh pengembang independen ArkNill. Dia mencatat setiap permintaan antara Claude Code dan Anthropic API dengan menyiapkan agen transparan, dan menemukan setidaknya dua bug cache klien yang membuat server API tidak dapat cocok dengan prefiks dialog cache, memaksa setiap putaran untuk melakukan rekonstruksi token lengkap。

Angka di atas menunjukkan perbandingan dari tiga tahap laju pembacaan cache. Selama periode v2.1.69 ke v.2.1.89 (titik seumur hidup Bug), hanya 4-17 persen dari laju akses cache tersedia bagi versi Bandalone. v2.1.90 Setelah memperbaiki salah satu bug kunci, cold- mulai tingkat membaca cache kembali ke 47-99.7 persen. Pada v2.1.91, tingkat pembacaan cache steadi- run telah kembali menjadi 97- 99%。

Perlu dicatat detail dalam grafik: kisaran v2.1.90 sangat luas (47 sampai 99,7 persen), karena masih perlu "pemanasan" ketika percakapan dilanjutkan, dengan hits rendah di putaran sebelumnya, tapi segera kembali ke tingkat normal. Dan dalam versi Bug, pemanasan ini tidak akan pernah terjadi - Membaca cache akan selalu tetap pada 14.500 token sistem petunjuk, dan setiap percakapan sejarah akan selalu bernilai penuh。


28 hari, 20 versi

bug ini bukan jenis yang diperkenalkan dalam salah satu pembaruan dan berikutnya. menurut catatan rilis npm registry, v2.1.69 diperkenalkan untuk bug diterbitkan pada 4 maret, dan v2.1.90 untuk bug perbaikan diterbitkan pada 1 april. 28 hari antara 20 versi。

Garis waktu mengungkapkan detail yang menarik. Ketika bug diperkenalkan pada 4 Maret, pengguna tidak segera mengajukan keluhan massal. Tidak sampai 23 Maret keluhan pecah, dengan interval hampir tiga minggu. Alasan untuk ini adalah, menurut masalah GitHub # 41930, dari 13 sampai 28 Maret, Anthropic online ke penjualan ganda (dua kali lebih tinggi), yang secara obyektif menyamarkan pengaruh bug. Setelah promosi selesai, konsumsi bug cache kembali ke normal biaya dasar, dengan jumlah pengguna "menguap" dalam sekejap。

Respon Anthropic tidak datang dengan cepat. Pada 26 Maret, tiga hari setelah wabah keluhan pengguna, insinyur Tariq Shihipar mengumumkan pada akun pribadinya X bahwa langit-langit selama jam puncak (5am-11 PT) telah diperketat. Pada tanggal 30 Maret, Anthropic mengakui di Reddit bahwa "pengguna mencapai batas pada tingkat yang jauh lebih cepat daripada yang diharapkan" dan menyatakan bahwa itu telah diberikan prioritas tim tertinggi. Tidak sampai 1 April bahwa anggota tim Lydia Hallie merilis temuan resmi。

Sepanjang proses, Anthropic tidak menerbitkan posting blog, tanpa mengirim email, dan tidak memperbarui halaman status. Semua komunikasi resmi dilakukan hanya melalui posting media sosial pribadi insinyur dan sejumlah kecil komentar Reddit。


Berapa banyak kau bayar? Berapa lama

Masalah GitHub # 41930 mengumpulkan ratusan laporan pengguna. Kasus yang paling ekstrim adalah bahwa dari pelanggan Max 20x ($200 / bulan), yang lima jam gulungan jendela benar-benar habis dalam 19 menit. Max 5x user ($100 / bulan) melaporkan jendela 5 jam berjalan keluar dalam 90 menit. Menurut The Letter Two, "hello" sederhana digunakan untuk mengkonsumsi 13% dari kuota sesi. Satu pengguna Pro ($20 / bulan) mengatakan dalam Discord bahwa kuota itu "digunakan pada hari Senin dan diganti pada hari Sabtu" dan hanya 12 hari dalam 30 hari。

Menurut tes ArkNill benchmark, pada versi bug v2.1.89, 100% kuota dari program Max 20x akan habis dalam waktu sekitar 70 menit. Dia juga menghitung biaya operasi single- resume untuk sesi token 500K di sekitar 0.15, karena sistem akan sepenuhnya direset。


"Kau salah ambil"

Penemuan Lydia Hallie mengkonfirmasi dua poin, salah satunya adalah bahwa batas waktu maksimum memang diperketat dan lain dari 1 juta token konteks dengan peningkatan konsumsi percakapan. Dia mengklaim bahwa tim memperbaiki beberapa bug, tapi menekankan bahwa "tidak ada salah satu bug menghasilkan biaya tambahan"。

Dia kemudian membuat empat rekomendasi:

Penggunaan Sonnet 4.6 bukan Opus (tingkat konsumsi opus kira-kira dua kali)

2. mengurangi penalaran atau menutup ketika dalam-mendalam penalaran tidak diperlukan

3

TATA VARIABEL LINGKUNGAN CLADE CODE AUTO KOMPAT WINDOW = 200000 UNTUK MEMBATASI UKURAN JENDELA KONTEKS。

Tidak ada referensi dibuat untuk setiap bentuk kuota pengganti atau kompensasi。

AI podcast host Alex Volkov merangkum respon sebagai "You 're holding it wrong" dan menunjukkan bahwa Anthropic sendiri menetapkan 1 juta token context sebagai default, dipromosikan Opus sebagai model flagship, dijual sebagai titik penjualan, dan sekarang disarankan payer untuk tidak menggunakan fungsi tersebut。

The "tidak ada biaya lebih" klaim juga dalam ketegangan dengan Claude Code sendiri diperbarui catatan. Hanya satu hari sebelum Lydia mengeluarkan responnya, v2.1.90 memperbaiki bug cache kembali dari v2.1.69: ketika menggunakan --resume untuk melanjutkan sesi, permintaan yang seharusnya telah mencapai cache memicu kehilangan cache cepat penuh dengan harga penuh. Anomali biaya yang dikonfirmasi ini tidak disebutkan dalam tanggapan Lydia。

Sebaliknya, naskah kuno OpenAI memiliki masalah konsumsi yang sama sebelumnya. Pendekatan OpenAI adalah untuk mereset kuota pengguna, mengesahkan kembali nomor kredit dan mengumumkan bulan Maret bahwa langit-langit Codex akan dihapus. Pendekatan Anthropic adalah merekomendasikan model ke bawah, mematikan fungsi, membatasi konteks dan atribut tanggung jawab ke mode penggunaan pengguna。

Anthropic menjual subscriptions ke "Power Model + Maximum Context + Maximum Logic Capability" untuk antara $20 dan $200 per bulan. A 28-day cache dari bug memungkinkan membayar pengguna menguap pada 10- 20 kali tingkat, dan respon resmi adalah untuk menyelamatkan Anda。

QQlink

No crypto backdoors, no compromises. A decentralized social and financial platform based on blockchain technology, returning privacy and freedom to users.

© 2024 QQlink R&D Team. All Rights Reserved.