jtokeniser

راه حل نرم افزار راان است ه مجموعه ا از مجموعه ا از tokenisers را ه به طور مستقم با زبان طبع برخورد م ند
انون بارر ن

jtokeniser رتبه بند و خلاصه

تبلغات

  • Rating:
  • مجوز:
  • GPL
  • نام ناشر:
  • Andy Roberts
  • سستم ها عامل:
  • Windows All / Unix
  • حجم فال:
  • 83 KB

jtokeniser برسب ها


jtokeniser شرح

رشته ها را به نشانه ها / لمات متشل از آن م تواند برا نمونه ها غر ب اهمت اثبات ند. به طور خاص، هنام ه شما با زبان طبع برخورد م ند، باد به منظور جداساز لمات، باد از نشانه ذار استفاده ند. هر از tokenisers ساختار مشابه را به java.util.stringtokenizer از نظر نحوه استفاده از لاس ها و استخراج نشانه ها اتخاذ م ند. ان به ان معن است ه آنها برا استفاده ساده هستند. شما م تواند وارد، و سباندن، و ا حت فال متن را به برنامه اضافه ند. شما باد Tokeniser خود را انتخاب ند (و هر زنه مورد علاقه) و سس دمه tokenise را فشار دهد. نتاج شما به محض ردازش نماش داده م شود و شما م تواند زنه ا برا ذخره نتاج به فال، ار شما انتخاب ند. GUI مخصوصا برا آزماش روش ها Tokenisation در محط آموزش (مانند دوره NLP) مفد است. ان نز علاقه مند به سان است ه مال به استفاده از تابخانه JTokeniser هستند، اما تجربه برنامه نوس جاوا را برا استفاده از د به طور مستقم ندارند. jtokeniser شامل هار تادزها است ه همه را از لاس Tokeniser سترش م دهد: Whitespacetokeniser - ان رشته را در تمام رخداد فضا خال تقسم م ند ه شامل فضاها، جدد، زبانه ها و خط ها خط م شود. StringTokeniser - ان اساسا همانند java.util.stringtokenizer با برخ از روش ها اضاف (و سترش از tokeniser). رفتار ش فرض آن به عنوان whitespacetokenter عمل م ند، با ان حال، شما م تواند مجموعه ا از اراترها را ه باد برا نشان دادن دلالترها لمه استفاده م شود را مشخص ند. regextokeniser - ان tokeniser بسار انعطاف ذر است زرا شما م تواند از عبارات منظم برا تعرف نشانه استفاده ند. بنابران، "\ w +" به معنا هر زمان ه با ا ند حرف مطابقت دارد، ان لمه را در نظر م رد. به طور ش فرض، از عبارت منظم معادل به فضا خال استفاده م ند. regexseparatortokeniser - ان را م توان به عنوان stringtokeniser شرفته مورد توجه قرار رد. در حال ه Stringtokeniser محدود به تعرف دلال به عنوان مجموعه ا از شخصت ها فرد، RegexseParatortoKniser م تواند از عبارات منظم برا رورد غن تر و انعطاف ذر استفاده ند. Breakiteratortokeniser - از ده ترن تنان در تابخانه، ار ه باد فقط در رشته ها طبع زبان برا جداساز لمات استفاده شود. همنن با قوانن داخل ساخته شده در مورد ون دا ردن لمات، دانستن نحوه نادده رفتن نقطه ذار، و غره م آد. SenteCetokeniser - ان همنن از برستر مانند بالا استفاده م ند، اما به سمت دا ردن مرزها جمله تنظم شده است. "نشانه ها" در ان tokeniser در واقع جملات فرد هستند.


jtokeniser نرم افزارها مرتبط

xtas

XTAS XML JAVA API با هدف * دستار * XML داده ها از هر دو: منابع غر مداوم و مداوم ...

260 3.1 MB

دانلود

شوخ

Schifra خطا دذار د Reed-Solomon بسار قو، بسار بهنه شده و بسار قابل تنظم است ...

204 63 KB

دانلود