Program menurut wikipedia2xml.sf.net
-
wikipedia2XML Gratis
Kumpulan skrip python untuk membuat dan menangani corpus XML (koleksi besar teks untuk tujuan linguistik) dari dump cadangan database Wikipedia asli. Ini termasuk parser berbasis ekspresi reguler untuk bahasa markup MediaWiki