wikipedia2XML 0.1

Lisensi: Gratis ‎Ukuran file: N/A
‎Peringkat Pengguna: 3.0/5 - ‎1 ‎Suara

Tentang wikipedia2XML

Kumpulan skrip python untuk membuat dan menangani corpus XML (koleksi besar teks untuk tujuan linguistik) dari dump cadangan database Wikipedia asli. Ini termasuk parser berbasis ekspresi reguler untuk bahasa markup MediaWiki.