تجزیه و تحلیل متن ( TEXT ANALYTICS)، مجموعه ای از تکنیک های یادگیری ماشینی، آماری و زبانی را برای پردازش حجم زیادی از متن بدون ساختار (unstructured text) یا متنی که قالب از پیش تعریف شده ای ندارد، ترکیب می کند تا الگوهای درونی را استخراج کند. کسبوکارها، دولتها، محققان و رسانهها را قادر میسازد تا از محتوای عظیمی که در اختیار دارند برای تصمیمگیریهای حیاتی بهرهبرداری کنند. تجزیه و تحلیل متن از تکنیک های مختلفی استفاده می کند مثل: تجزیه و تحلیل احساسات، مدل سازی موضوع، شناسایی موجودیت نامگذاری شده، فراوانی اصطلاح و استخراج رویداد.
دو نکته مهم: 1) داده های بدون ساختار و 2) حجم بالای داده (بیگ دیتا)
تفاوت متن کاوی و تجزیه و تحلیل متن:
گاهی این دو اصطلاح به جای هم بکار می روند اما اصطلاح متن کاوی به طور کلی برای استخراج بینش کیفی از متن بدون ساختار استفاده می شود، در حالی که تجزیه و تحلیل متن نتایج کمی را ارائه می دهد.
به عنوان مثال:
از متن کاوی می توان برای تشخیص رضایت مشتریان از یک محصول با تجزیه و تحلیل نظرات و نظرسنجی های آنها استفاده کرد.
تجزیه و تحلیل متن برای شناسایی یک الگو یا روند از متن بدون ساختار استفاده می شود. به عنوان مثال، تجزیه و تحلیل متن می تواند برای درک امتیاز منفی تجربه مشتری یا محبوبیت یک محصول استفاده شود. (چرا یک مشتری به یک کالا امتیاز منفی داده و یا چرا یک محصول از محبوبیت بیشتری برخوردار است)
Text Mining، مجموعه به هم پیوسته از فناوری هایی است که برای پردازش و تحلیل انواع داده های نیم ساخت یافته و غیرساخت یافته به کار می رود و سعی دارد که حروف و واژگان را به عدد (ساختارمند کند) تبدیل کند. درحقیقت متن کاوی، به تحلیل هوشمند متن، داده کاوی متنی یا کشف دانش در متن معروف است و به فرایند استخراج دانش و اطلاعات مهم از مجموعه متنی غیرساختاریافته اشاره دارد.
این مباحث برای دانشجویان علم اطلاعات و دانش شناسی گردآوری و ارائه می شود