LinguaStream - LinguaStream

LinguaStream uchun umumiy platforma Tabiiy tilni qayta ishlash (NLP), elektron hujjatlarni bosqichma-bosqich boyitishga asoslangan. LinguaStream ishlab chiqilgan GREYC (Frantsiya: Groupe de recherche en informatique, image, automatique et instrumentation de Caen) informatika tadqiqot guruhi (Kan universiteti ) 2001 yildan beri. Shaxsiy foydalanish va tadqiqot maqsadlarida bepul foydalanish mumkin.

Tavsif

LinguaStream kompleks ishlov berish oqimlarini ishlab chiqish va baholash, har xil va darajadagi tahlil komponentlarini yig'ish imkonini beradi: nutqning bir qismi, sintaksis, semantik, nutq yoki statistik. Qayta ishlash oqimining har bir bosqichi kashf etadi va keyingi bosqichlarga tayanishi mumkin bo'lgan yangi ma'lumotlarni ishlab chiqaradi. Oqim oxirida bir nechta vositalar tahlil qilingan hujjatlar va ularning izohlarini qulay tarzda tasavvur qilishga imkon beradi.

LinguaStream - bu avvalo NLP tadqiqotchilariga mo'ljallangan virtual laboratoriya. Bu korpuslar bo'yicha murakkab eksperimentlarni qulay tarzda amalga oshirishga imkon beradi, har xil turdagi deklarativ rasmiyatchiliklardan foydalangan holda va rivojlanish xarajatlarini sezilarli darajada kamaytiradi. Uning qo'llanishi korpuslarni qidirishdan tortib to to'liq ishlaydigan avtomatik analizatorlarni ishlab chiqarishga qadar. Tajribani amalga oshirishning barcha bosqichlariga erishish mumkin bo'lgan yaxlit muhit platforma bilan ta'minlangan.

Texnologiya

Platforma sifatida LinguaStream keng imkoniyatlarni taqdim etadi Java API. Masalan, u bilan birlashtirilishi mumkin Java EE oqimlarni qayta ishlash asosida veb-ilovalarni ishlab chiqish uchun serverlar. Bundan tashqari, u o'quv uchun ishlatiladi va talabalarga bag'ishlangan maxsus modullarni taqdim etadi.

Adabiyotlar

  • "LinguaStream: hisoblash lingvistikasi eksperimentlari uchun integral muhit", F. Bilxaut va A. Vidlocher (2006). Hisoblash lingvistikasi assotsiatsiyasi (EACL) Evropa bo'limining 11-konferentsiyasi materiallarida (Companion Volume), Trento, Italiya.
  • "Une plate-forme logicielle et une démarche pour la validation de ressources linguistiques sur corpus: application à l'évaluation de la détection automatique de cadres temporels", S. Ferrari, F. Bilhaut, A. Widlöcher, M. Laignelet (2005) . Actes des 4èmes Journées de Linguistique de Corpus, Lorient, Frantsiya.
  • "La plate-forme LinguaStream: un outil d'exploration linguistique sur corpus", A. Vidlocher va F. Bilxaut (2005). Actes de la 12e Conférence Traitement Automatique du Language Naturel (TALN), Dourdan.
  • "La plate-forme LinguaStream", F. Bilxaut va A. Vidlocher (2005). Journée ATALA "Articuler les traitements sur corpus", Parij, Frantsiya.
  • "LinguaStream platformasi", F. Bilhaut (2003). Tabiiy tilni qayta ishlash bo'yicha 19-Ispaniya jamiyati konferentsiyasi (SEPLN), Alkala de Henares, Ispaniya, 339-340.

Tashqi havolalar