Gensim - Gensim

Gensim
Gensim logo.png
Asl muallif (lar)Radim Chexek
Tuzuvchi (lar)RARE Technologies Ltd.
Dastlabki chiqarilish2009
Barqaror chiqish
3.8.3[1] / 4 may 2020 yil; 7 oy oldin (4 may 2020 yil)
Omborgithub.com/ RaRe-Technologies/ gensim
YozilganPython
Operatsion tizimLinux, Windows, macOS
TuriAxborot olish
LitsenziyaLGPL
Veb-saytradimrehurek.com/ gensim/

Gensim bu ochiq manbali nazoratsizlar uchun kutubxona mavzuni modellashtirish va tabiiy tilni qayta ishlash, zamonaviy statistik ma'lumotlardan foydalangan holda mashinada o'rganish.

Gensim amalga oshiriladi Python va Cython. Gensim ma'lumotlar oqimini va qo'shimcha onlayn algoritmlarni ishlatib, katta hajmdagi matn to'plamlarini boshqarish uchun mo'ljallangan bo'lib, bu ularni faqat xotirada ishlashga yo'naltirilgan boshqa ko'plab kompyuterlarni o'rganish dasturiy ta'minot paketlaridan ajratib turadi.

Asosiy xususiyatlar

Gensim-ga oqimlarning parallellashtirilgan dasturlari kiradi fastText,[2] word2vec va doc2vec algoritmlari,[3] shu qatorda; shu bilan birga yashirin semantik tahlil (LSA, LSI, SVD), salbiy bo'lmagan matritsali faktorizatsiya (NMF), yashirin Dirichlet ajratish (LDA), tf-idf va tasodifiy proektsiyalar.[4]

Gensimdagi ba'zi yangi onlayn algoritmlar 2011 yil nomzodlik dissertatsiyasida ham nashr etilgan Tabiiy tilni qayta ishlashda semantik tahlilning miqyosi Gensimning yaratuvchisi Radim Chexek.[5]

Gensim-dan foydalanish

Gensim 2018 yilga kelib 1400 dan ortiq tijorat va akademik dasturlarda ishlatilgan va keltirilgan,[6] tibbiyotdan sug'urta da'volarini tahlil qilishgacha patent qidirishgacha bo'lgan turli xil fanlar qatorida.[7] Dastur bir nechta yangi maqolalar, podkastlar va intervyularda yoritilgan.[8][9][10]

Bepul va tijorat yordami

Ochiq kodli kod ishlab chiqilgan va joylashtirilgan GitHub[11] va jamoatchilikni qo'llab-quvvatlash forumi davom etmoqda Google guruhlari[12] va Gitter.[13]

Gensimni nodir-technologies.com kompaniyasi qo'llab-quvvatlaydi, shuningdek talabalar uchun Inkubator dasturi orqali talabalarga ustozlik va akademik tezis loyihalarini taqdim etadi.[14]

Adabiyotlar

  1. ^ "3.8.3 versiyasi". 4 may 2020 yil. Olingan 4 may 2020.
  2. ^ Kengaytirilgan * 2vec mashg'ulot
  3. ^ Word2vec va Gensim bilan chuqur o'rganish
  4. ^ Radim Chexek va Petr Sojka (2010). Katta korpuslar bilan mavzuni modellashtirish uchun dasturiy ta'minot bazasi. Proc. LREC NLP Framework uchun yangi muammolarga bag'ishlangan seminar
  5. ^ Chexek, Radim (2011). "Tabiiy tilni qayta ishlashda semantik tahlilning ko'lamliligi" (PDF). Olingan 27 yanvar 2015. mening ochiq manbam jensim ushbu tezis bilan birga kelgan dasturiy ta'minot to'plami
  6. ^ Gensim akademik ma'lumotlari
  7. ^ Gensim kompaniyasining tijorat tomonidan qabul qilinganlari
  8. ^ Podcast .__ init__ # 71-qism Gensim-da
  9. ^ Gensim yaratuvchisi Radim Chexek bilan intervyu
  10. ^ http://decisionstats.com/2015/12/07/decisionstats-interview-radim-rehurek-gensim-python/
  11. ^ Github-da Gensim manba kodi
  12. ^ Google Groups-dagi Gensim pochta xabarlari ro'yxati
  13. ^ Gitter-da Gensim suhbat xonasi
  14. ^ Gensim ochiq manbali inkubator

Tashqi havolalar