wikipedia2XML 0.1

Lisensi: Gratis ‎Ukuran file: N/A
‎Peringkat Pengguna: 3.0/5 - ‎1 ‎Suara

Kumpulan skrip python untuk membuat dan menangani corpus XML (koleksi besar teks untuk tujuan linguistik) dari dump cadangan database Wikipedia asli. Ini termasuk parser berbasis ekspresi reguler untuk bahasa markup MediaWiki.

Riwayat versi

  • Versi 0.1 diposting di 2008-04-01
    Beberapa perbaikan dan pembaruan
  • Versi 0.1 diposting di 2008-04-01

Detil Program