Mungkin Google Cache sudah ada kenal, apabila situs yang diakses bermasalah maka tinggal kembali ke hasil pencarian dan klik cache. Tampilan halaman sesuai yang disimpan Google akan muncul. Kekurangannya hanya versi terbaru yang disimpan. Alternatifnya adalah Internet Wayback Machine yang menyimpan riwayat situs selengkap mungkin dan malah bisa dibuat browsing langsung dari arsipnya.
Nahβ¦ kasusnya kali ini konten β konten situs lama masih bisa diakses dari sana, dan oleh teman saya tidak ingin disalahgunakan. Dan aslinya solusi untuk masalah ini cukup mudah.
Cara menghapus website dari Archive.org
- Kita tinggal mengirimkan email ke [email protected] atau [email protected] dan dengan judul Site Removal Request: nama^domain.com.
Tapi tentu saja tidak langsung minta dihapus semua kontennya, kita harus memberikan bukti memang yang memohon adalah pemiliknya dan alasannya.
Kalau kesulitan menulis apa, bisa copas email yang pernah saya gunakan. Pakai bahasa Inggris tentunya, dan ini yang saya kirimkan:
Hi Internet Wayback Machine Team, I want to request a site removal from archive.org. Here is the url: nama^domain.com and this the archive.org link: https://web.archive.org/web/*/nama^domain.com
- Dalam seminggu biasanya akan dibalas, ya memang ga fast response. Dan biasanya akan diminta verifikasi kepemilikan situs/domain. Paling mudah dengan sistem pembuatan konten, bisa dengan upload file TXT ke websitenya.
Isikan teks berisi konfirmasi penghapusan situs dari Internet Archive. Atau membuat halaman baru dengan informasi serupa. Nanti kirimkan URLnya sebagai balasan. Alternatifnya kirim email dari domain situs anda, dan ini saya yakin ga semuanya punya atau bisa dipakai.
- Persyaratan baru sejak 2020. Juga akan diminta bukti pembelian nama domain paling awal dalam bentuk PDF. Jadi invoicenya yang dikirimkan via email.
- Kalau berhasil nanti akan ada email balasan bahwa permintaan kita diproses. Seperti berikut:
Hello,
The site/URL referenced in your email below has now been submitted for exclusion from the Wayback Machine at https://www.archive.org:
nama^domain.com
Please allow up to a day for the automated portions of the process to run their course and for the changes to take effect. If you have any other questions or concerns, please let us know.
β
The Internet Archive Team - Sekian
Misalkan anda beli nama domain yang sudah pernah aktif sebelumnya atau dipakai orang lain, tentu tidak ada akses ke invoice pembelian mereka. Misal websitenya pernah aktif 2012-2014, anda baru beli 2016 dan cuma bisa memberikan tahun ini. Maka ini berpengaruh ke sejauh mana archive.org menghapus kontennya, dalam contoh ya dari 2016 sampai sekarang.
Kalau dirasa kirim email itu repot bisa mencoba solusi lainnya, kita menginstruksikan ke bot Internet Archive bahwa konten kita tidak ingin diindeks bot mereka.
Cara pasif blokir konten disimpan Archive.org
- Buat atau edit file robots.txt pada web hosting anda. Lokasinya
nama^domain.com/robots.txt
- Kalau kosong langsung isikan kode berikut, tapi kalau edit maka tambahkan di posisi paling bawah jadi kode yang sudah ada tidak perlu dihapus atau diganti.
User-agent: ia_archiver Disallow: /
- Dalam waktu 2 mingguan biasanya sudah bersih konten anda di archive.org
Kurang lebih begitu dan mohon maaf bahasa Inggris saya belepotan. Tapi intinya seperti itu. Antara akan langsung dituruti permintaan anda untuk membersihkan simpanan arsipnya atau akan diminta bukti lebih lanjut. Jangan lupa gantikan nama^domain dengan domain yang ingin anda hapus.
Update Februari 2021
Ada perubahan dalam sistem penghapusan konten di archive.org, secara garis besar adalah sama prosesnya dengan tutorial diatas. Cuma beda di detail dan apa yang dihapus.
Semoga bermanfaat. π
Mau tanya, misal ada CEO mengaku kerjasama dengan Broker forex yang sudah berdiri selama puluhan tahun dengan menunjukkan who.is, Namun ketika dicek history nya pada tahun 2005 ketahuan bahwa web broker tersebut adalah jualan alat-alat komputer, dan domain web tersebut sempat dijual tahun 2014 dan baru berubah jadi web broker pada tahun 2018. Dengan history seperti itu apakah pemilik domain terbaru masih bisa melakukan penghapusan content di wayback machine untuk menghilangkan rekam jejak digital sebelum dibeli oleh broker forex tersebut? Kalau history seperti itu juga bisa dihapus maka menurut saya akan memudahkan penipuan. Mohon penjelasannya
Halo mas, kebetulan saya baru saja mengurus hapus konten di archive.org.
Saat saya menulis artikel diatas, kekhawatiran anda benar adanya. Karena tidak ditanyakan sama sekali, cuma perlu verifikasi kepemilikan domain maka akan dihapus semuanya.
Tapi mulai 2020 tampaknya, kita perlu menyerahkan bukti invoice pembelian nama domain dalam bentuk PDF. Dan akan dihapus sesuai tahunnya, misal belinya 2018 ya cuma itu saja dan setelahnya (2019-2020-2021-dst) yang diproses. Yang sebelumnya dibiarkan.