LinuxManiax
24th October 2012, 10:17 PM
Thread ini di Buat nambah pengetahuan aja yah bahwa
tidak ada web yang paling aman
TS kebetulan dapat dari browsing google
mencari teknologi OCR yang bagus
mudah-mudahan mimin dan momod berkenan
kalau tidak delete saja thread ini
kalau untuk kaskus mudah-mudahan
teknik ini tidak bisa digunakan
karena captcha yang muncul orang membacanya saja susah apalagi komputer
contohnya capcay ini bacaannya apa?
https://lh5.googleusercontent.com/-DbqXpM72WAg/TWyAv169-hI/AAAAAAAAADE/utbQdUExKaQ/s1600/capcay.jpg
TS belum pernah coba, silahkan sharing yang sudah coba:
source thread ini dari tempebasah (http://tempebasah.com/menjebol-captcha-dengan-ocr-zid*du-com)
mohon ijin suhu-suhu dan master-master yang belum tau apa itu OCR
berikut penjelasannya:
OCR adalah Kemampuan yang dimiliki program khusus untuk membaca dan mengubah materi teks pada file objek gambar menjadi file teks biasa. Jika sebuah dokumen di-scan, maka output yang diperoleh di komputer adalah file gambar. Program OCR berfungsi membantu Anda mengubah secara otomatis materi teks di dalam gambar hasil scan agar menjadi file teks yang bisa diolah. Tujuannya agar sumber teks dapat diambil tanpa harus menulis ulang secara manual. Tingkat ketelitian dan keakuratan hasil pembacaan program OCR sangat beragam dan tergantung juga pada sumber dokumen. Jika teks pada gambar terlalu kecil, buram, atau tidak bersih, maka kesalahan pembacaan mungkin saja terjadi. Meskipun demikian, pengeditan hasil OCR dianggap tetap lebih efisien dibandingkan jika menulis ulang sejumlah dokumen atau lembar kiriman fax secara manual. Contoh software OCR adalah ReadIris dan OmniPage.
Lalu apa hubungannya OCR dengan captcha.
Banyak orang menyangka asalkan situsnya dijaga captcha, maka spammer tidak akan bisa menembusnya. Padahal ini salah besar! Captcha memang menyulitkan, namun tidak sembarang captcha, bila captcha tidak dibuat dengan benar dan asal-asalan, maka spammer bisa dengan mudah menembusnya. salah satu teknik spammer menembus captcha adalah dengan
teknologi OCR.
Captcha Basics
Captcha adalah akronim dari Completely Automated Public Turing test to tell Computers and Humans Apart, yaitu sebuah test/ujian yang �fully automated� untuk membedakan manusia dan komputer. Ujian captcha dibuat sedemikian rupa sehingga teknologi komputer saat ini belum bisa mengerjakan dengan benar, namun manusia bisa dengan mudah menyelesaikan dengan sempurna.
Captcha ini dibuat oleh komputer secara otomatis, namun komputer sendiri sebagai pembuat soal malah tidak bisa mengerjakannya� Aneh!
Umumnya captha berbentuk gambar yang di dalamnya terdapat kode. Kode ini bisa dengan mudah dibaca manusia, namun komputer akan kesulitan membaca kode dalam gambar itu. Dengan cara ini, hanya manusia yang bisa melanjutkan prosesnya, sedangkan komputer/robot akan gagal.
Bagi komputer, sebuah gambar hanyalah kumpulan kode-kode warna dari setiap pixelnya. Dibutuhkan proses yang cukup rumit untuk bisa mengenali objek pada gambar, apalagi untuk memahami arti sebuah gambar. Sedangkan bagi manusia hanya dalam hitungan seper sekian detik kode dalam gambar sudah terbaca.
Selain berbentuk gambar, captcha juga ada yang berbentuk suara. Secara prinsip sama saja dengan gambar, komputer perlu melakukan proses yang rumit untuk mengenali percakapan dalam file suara.
Program OCR yang bisa dipakai dalam menembus captcha adalah GNU OCR (http://jocr.sourceforge.net/index.html). Seperti program OCR lainnya, GOCR hanya dapat membaca captcha dengan baik bila gambarnya tidak banyak gangguan. Untuk itu biasanya sebelum gambar dilempar ke GOCR, sebelumnya diolah dulu untuk meminimalkan gangguan agar hasil pembacaan GOCR bisa maksimal.
Dalam artikel ini saya akan jelaskan bagaimana captcha bisa ditembus dengan GOCR di sistem operasi Linux. Sebagai contoh saya akan gunakan captcha yang ada di situs sharing zid*du.com.
Captcha zid*du.com
Penggunaan captcha pada zid*du sangat vital karena situs ini membayar pemilik file setiap kali ada orang yang mendownload file tersebut. Bisa dibayangkan bila tanpa captcha, maka orang dengan mudah bisa membuat script untuk melakukan download secara otomatis.
Namun dari FAQ yang saya baca, zid*du hanya membayar berdasarkan ip address yang unique dalam satu hari. Jadi bilapun ada script yang bisa melakukan download berulang kali, tetap tidak dianggap selama berasal dari ip address yang sama.
Contoh gambar captcha zid*du antara lain:
http://www.ilmuhacking.com/wp-content/uploads/2009/01/capcay1.jpg
Setelah saya cari di google file CaptchaSecurityImages.php (http://www.white-hat-web-design.co.uk/articles/php-captcha.php) ternyata adalah library open source untuk men-generate captcha, namanya PHP Captcha Security Image . Library ini cukup populer dan banyak dipakai di situs luar maupun situs lokal. Situs iklan gratis banyak juga yang pakai captcha ini, silakan cek sendiri.
Kelemahan Captcha zid*du
Beberapa kelemahan captcha yang dipakai zid*du adalah:
* Objek dan Background Terpisah: Sepintas terlihat captcha zid*du cukup rumit karena banyak gangguan berupa coretan dan bintik-bintik. Namun sebenarnya gangguan itu tidak ada artinya karena terpisah jelas dengan warna yang berbeda cukup kontras. Jadi antara objek dengan background terpisah dengan baik, dengan sedikit pengolahan akan didapatkan gambar yang bersih dari gangguan.
* Tidak adan rotasi, semua karakter horisontal posisinya, tidak ada yang miring ke atas atau ke bawah.
* Font yang monoton dan konsisten.
* Warna yang konsiten.
Persiapan Gambar dengan Utility Convert
Convert (http://www.imagemagick.org/script/convert.php) adalah utility command line dari ImageMagick yang bisa melakukan berbagai jurus pengolahan gambar, dari yang sederhana hingga yang rumit. Untuk memecahkan captcha zid*du kita tidak perlu jurus tingkat tinggi, cukup operasi sederhana saja. Kita pakai operasi threshold, operasi ini bekerjanya sangat sederhana. Kita hanya perlu menetapkan suatu nilai batas, kemudian semua pixel yang memiliki kode warna di bawah atau di atas nilai itu akan diubah menjadi warna putih atau hitam.
Dari contoh-contoh captcha yang ada terlihat bahwa warna yang paling gelap adalah warna kode, kemudian diikuti dengan warna noise dan yang paling terang adalah warna background. Dengan demikian kita bisa tetapkan warna teks sebagai nilai threshold (batas), kemudian semua pixel yang memiliki warna lebih terang dari itu akan diubah menjadi putih. Dengan cara ini maka yang tertinggal hanyalah warna teks, warna background dan warna noise akan lenyap karena warnanya jadi putih.
Langkah pertama adalah kita harus mendownload gambar captcha yang asli, di URL:
cari aja di zi*ddu gambarnya terus di save
Contoh gambar captcha yang asli adalah:
http://www.ilmuhacking.com/wp-content/uploads/2009/01/capcaytest11.jpg
Dengan operasi threshold, gambar tersebut akan diconvert menjadi:
http://www.ilmuhacking.com/wp-content/uploads/2009/01/capcaytest2.jpg
Terlihat jelas gambar kedua lebih mudah dibaca oleh GOCR karena noise yang ada di gambar asli sudah dihilangkan. Perintah untuk melakukan operasi threshold di atas adalah:
--------------
$ convert captchatest.jpg -white-threshold 20000 captchatest2.jpg
---------------
Opsi white-threshold 20000, itu artinya semua pixel yang nilai warnanya lebih tinggi (lebih terang) dari itu, akan diubah menjadi putih. Hasilnya terlihat bahwa pada gambar ke-2 terlihat noise dan background menjadi putih bersih karena warna background dan noise lebih tinggi dari 20000.
Breaking Captcha dengan GOCR
Kini setelah gambar dibersihkan dari gangguan, telah siap untuk dibaca dengan GOCR. Mari kita lihat kemampuan GOCR membaca captcha yang asli, bila GOCR mencoba membaca gambar yang asli, hasilnya adalah karakter kacau seperti di bawah ini:
https://lh6.googleusercontent.com/-fE9kn6rbanE/TWx9utYD4fI/AAAAAAAAAC8/eV76Yptutmw/s1600/baliratih.jpg
Namun setelah diproses dengan threshold, maka hasilnya adalah:
https://lh6.googleusercontent.com/-fBWP7qQyB-I/TWx933IOXSI/AAAAAAAAADA/ckkb5Yrv-Kg/s1600/baliratih2.jpg
Wow, ternyata hasilnya sempurna. Setelah captcha terbaca selanjutnya terserah anda. Anda bisa melakukan register di zid*du.com dengan script. Ini sangat berbahaya, sebab seseorang bisa mendapatkan komisi dari setiap orang yang register di zid*du bila mendaftar melalui affiliate link. Bayangkan apa yang terjadi bila seseorang membuat robot yang melakukan registrasi dari link affiliate sebanyak 1 juta kali, padahal setiap orang yang mendaftar dari affiliate mendapat $0,1 artinya dia akan mendapat $100,000 atau 1 miliar.
Kesimpulan
Anda telah melihat sendiri betapa mudahnya captcha dijebol dengan software gratisan. Jangan pernah mengira bahwa hanya dengan memasang captcha asal-asalan spammer tidak akan bisa menembus. Pilihlah captcha yang baik dan sulit untuk ditembus.
Banyak situs-situs besar dalam dan luar negeri seperti detik..com, liputan6.com, zid*du.com, feedburner.com yang masih menggunakan captcha yang mudah ditembus. Di majalah underground info saya menulis tentang breaking captcha detik..com untuk mengakali hasil polling. Bahkan captcha detik..com jauh lebih mudah ditembus dibanding captcha zid*du.
TS terima :melonndan:
semoga TS bisa membalas dengan melon lagi
</div>
tidak ada web yang paling aman
TS kebetulan dapat dari browsing google
mencari teknologi OCR yang bagus
mudah-mudahan mimin dan momod berkenan
kalau tidak delete saja thread ini
kalau untuk kaskus mudah-mudahan
teknik ini tidak bisa digunakan
karena captcha yang muncul orang membacanya saja susah apalagi komputer
contohnya capcay ini bacaannya apa?
https://lh5.googleusercontent.com/-DbqXpM72WAg/TWyAv169-hI/AAAAAAAAADE/utbQdUExKaQ/s1600/capcay.jpg
TS belum pernah coba, silahkan sharing yang sudah coba:
source thread ini dari tempebasah (http://tempebasah.com/menjebol-captcha-dengan-ocr-zid*du-com)
mohon ijin suhu-suhu dan master-master yang belum tau apa itu OCR
berikut penjelasannya:
OCR adalah Kemampuan yang dimiliki program khusus untuk membaca dan mengubah materi teks pada file objek gambar menjadi file teks biasa. Jika sebuah dokumen di-scan, maka output yang diperoleh di komputer adalah file gambar. Program OCR berfungsi membantu Anda mengubah secara otomatis materi teks di dalam gambar hasil scan agar menjadi file teks yang bisa diolah. Tujuannya agar sumber teks dapat diambil tanpa harus menulis ulang secara manual. Tingkat ketelitian dan keakuratan hasil pembacaan program OCR sangat beragam dan tergantung juga pada sumber dokumen. Jika teks pada gambar terlalu kecil, buram, atau tidak bersih, maka kesalahan pembacaan mungkin saja terjadi. Meskipun demikian, pengeditan hasil OCR dianggap tetap lebih efisien dibandingkan jika menulis ulang sejumlah dokumen atau lembar kiriman fax secara manual. Contoh software OCR adalah ReadIris dan OmniPage.
Lalu apa hubungannya OCR dengan captcha.
Banyak orang menyangka asalkan situsnya dijaga captcha, maka spammer tidak akan bisa menembusnya. Padahal ini salah besar! Captcha memang menyulitkan, namun tidak sembarang captcha, bila captcha tidak dibuat dengan benar dan asal-asalan, maka spammer bisa dengan mudah menembusnya. salah satu teknik spammer menembus captcha adalah dengan
teknologi OCR.
Captcha Basics
Captcha adalah akronim dari Completely Automated Public Turing test to tell Computers and Humans Apart, yaitu sebuah test/ujian yang �fully automated� untuk membedakan manusia dan komputer. Ujian captcha dibuat sedemikian rupa sehingga teknologi komputer saat ini belum bisa mengerjakan dengan benar, namun manusia bisa dengan mudah menyelesaikan dengan sempurna.
Captcha ini dibuat oleh komputer secara otomatis, namun komputer sendiri sebagai pembuat soal malah tidak bisa mengerjakannya� Aneh!
Umumnya captha berbentuk gambar yang di dalamnya terdapat kode. Kode ini bisa dengan mudah dibaca manusia, namun komputer akan kesulitan membaca kode dalam gambar itu. Dengan cara ini, hanya manusia yang bisa melanjutkan prosesnya, sedangkan komputer/robot akan gagal.
Bagi komputer, sebuah gambar hanyalah kumpulan kode-kode warna dari setiap pixelnya. Dibutuhkan proses yang cukup rumit untuk bisa mengenali objek pada gambar, apalagi untuk memahami arti sebuah gambar. Sedangkan bagi manusia hanya dalam hitungan seper sekian detik kode dalam gambar sudah terbaca.
Selain berbentuk gambar, captcha juga ada yang berbentuk suara. Secara prinsip sama saja dengan gambar, komputer perlu melakukan proses yang rumit untuk mengenali percakapan dalam file suara.
Program OCR yang bisa dipakai dalam menembus captcha adalah GNU OCR (http://jocr.sourceforge.net/index.html). Seperti program OCR lainnya, GOCR hanya dapat membaca captcha dengan baik bila gambarnya tidak banyak gangguan. Untuk itu biasanya sebelum gambar dilempar ke GOCR, sebelumnya diolah dulu untuk meminimalkan gangguan agar hasil pembacaan GOCR bisa maksimal.
Dalam artikel ini saya akan jelaskan bagaimana captcha bisa ditembus dengan GOCR di sistem operasi Linux. Sebagai contoh saya akan gunakan captcha yang ada di situs sharing zid*du.com.
Captcha zid*du.com
Penggunaan captcha pada zid*du sangat vital karena situs ini membayar pemilik file setiap kali ada orang yang mendownload file tersebut. Bisa dibayangkan bila tanpa captcha, maka orang dengan mudah bisa membuat script untuk melakukan download secara otomatis.
Namun dari FAQ yang saya baca, zid*du hanya membayar berdasarkan ip address yang unique dalam satu hari. Jadi bilapun ada script yang bisa melakukan download berulang kali, tetap tidak dianggap selama berasal dari ip address yang sama.
Contoh gambar captcha zid*du antara lain:
http://www.ilmuhacking.com/wp-content/uploads/2009/01/capcay1.jpg
Setelah saya cari di google file CaptchaSecurityImages.php (http://www.white-hat-web-design.co.uk/articles/php-captcha.php) ternyata adalah library open source untuk men-generate captcha, namanya PHP Captcha Security Image . Library ini cukup populer dan banyak dipakai di situs luar maupun situs lokal. Situs iklan gratis banyak juga yang pakai captcha ini, silakan cek sendiri.
Kelemahan Captcha zid*du
Beberapa kelemahan captcha yang dipakai zid*du adalah:
* Objek dan Background Terpisah: Sepintas terlihat captcha zid*du cukup rumit karena banyak gangguan berupa coretan dan bintik-bintik. Namun sebenarnya gangguan itu tidak ada artinya karena terpisah jelas dengan warna yang berbeda cukup kontras. Jadi antara objek dengan background terpisah dengan baik, dengan sedikit pengolahan akan didapatkan gambar yang bersih dari gangguan.
* Tidak adan rotasi, semua karakter horisontal posisinya, tidak ada yang miring ke atas atau ke bawah.
* Font yang monoton dan konsisten.
* Warna yang konsiten.
Persiapan Gambar dengan Utility Convert
Convert (http://www.imagemagick.org/script/convert.php) adalah utility command line dari ImageMagick yang bisa melakukan berbagai jurus pengolahan gambar, dari yang sederhana hingga yang rumit. Untuk memecahkan captcha zid*du kita tidak perlu jurus tingkat tinggi, cukup operasi sederhana saja. Kita pakai operasi threshold, operasi ini bekerjanya sangat sederhana. Kita hanya perlu menetapkan suatu nilai batas, kemudian semua pixel yang memiliki kode warna di bawah atau di atas nilai itu akan diubah menjadi warna putih atau hitam.
Dari contoh-contoh captcha yang ada terlihat bahwa warna yang paling gelap adalah warna kode, kemudian diikuti dengan warna noise dan yang paling terang adalah warna background. Dengan demikian kita bisa tetapkan warna teks sebagai nilai threshold (batas), kemudian semua pixel yang memiliki warna lebih terang dari itu akan diubah menjadi putih. Dengan cara ini maka yang tertinggal hanyalah warna teks, warna background dan warna noise akan lenyap karena warnanya jadi putih.
Langkah pertama adalah kita harus mendownload gambar captcha yang asli, di URL:
cari aja di zi*ddu gambarnya terus di save
Contoh gambar captcha yang asli adalah:
http://www.ilmuhacking.com/wp-content/uploads/2009/01/capcaytest11.jpg
Dengan operasi threshold, gambar tersebut akan diconvert menjadi:
http://www.ilmuhacking.com/wp-content/uploads/2009/01/capcaytest2.jpg
Terlihat jelas gambar kedua lebih mudah dibaca oleh GOCR karena noise yang ada di gambar asli sudah dihilangkan. Perintah untuk melakukan operasi threshold di atas adalah:
--------------
$ convert captchatest.jpg -white-threshold 20000 captchatest2.jpg
---------------
Opsi white-threshold 20000, itu artinya semua pixel yang nilai warnanya lebih tinggi (lebih terang) dari itu, akan diubah menjadi putih. Hasilnya terlihat bahwa pada gambar ke-2 terlihat noise dan background menjadi putih bersih karena warna background dan noise lebih tinggi dari 20000.
Breaking Captcha dengan GOCR
Kini setelah gambar dibersihkan dari gangguan, telah siap untuk dibaca dengan GOCR. Mari kita lihat kemampuan GOCR membaca captcha yang asli, bila GOCR mencoba membaca gambar yang asli, hasilnya adalah karakter kacau seperti di bawah ini:
https://lh6.googleusercontent.com/-fE9kn6rbanE/TWx9utYD4fI/AAAAAAAAAC8/eV76Yptutmw/s1600/baliratih.jpg
Namun setelah diproses dengan threshold, maka hasilnya adalah:
https://lh6.googleusercontent.com/-fBWP7qQyB-I/TWx933IOXSI/AAAAAAAAADA/ckkb5Yrv-Kg/s1600/baliratih2.jpg
Wow, ternyata hasilnya sempurna. Setelah captcha terbaca selanjutnya terserah anda. Anda bisa melakukan register di zid*du.com dengan script. Ini sangat berbahaya, sebab seseorang bisa mendapatkan komisi dari setiap orang yang register di zid*du bila mendaftar melalui affiliate link. Bayangkan apa yang terjadi bila seseorang membuat robot yang melakukan registrasi dari link affiliate sebanyak 1 juta kali, padahal setiap orang yang mendaftar dari affiliate mendapat $0,1 artinya dia akan mendapat $100,000 atau 1 miliar.
Kesimpulan
Anda telah melihat sendiri betapa mudahnya captcha dijebol dengan software gratisan. Jangan pernah mengira bahwa hanya dengan memasang captcha asal-asalan spammer tidak akan bisa menembus. Pilihlah captcha yang baik dan sulit untuk ditembus.
Banyak situs-situs besar dalam dan luar negeri seperti detik..com, liputan6.com, zid*du.com, feedburner.com yang masih menggunakan captcha yang mudah ditembus. Di majalah underground info saya menulis tentang breaking captcha detik..com untuk mengakali hasil polling. Bahkan captcha detik..com jauh lebih mudah ditembus dibanding captcha zid*du.
TS terima :melonndan:
semoga TS bisa membalas dengan melon lagi
</div>