استخراج المعلومات (ذكاء اصطناعي)

استخراج المعلومات[1] (آي أي) هو نوع من استرجاع المعلومات التي تهدف إلى استخراج المعلومات المهيكلة تلقائيا من الوثائق غير المهيكلة المقروءة آليا، بشكل عام استخراج المعلومات المهيكلة من نصوص اللغات البشرية عن طريق معالجة اللغة الطبيعية.

ونظرا لصعوبة المشكلة، فإن النهج الحالي لاستخراج المعلومات هو التركيز على مجالات محدودة ضيقة. ومن الأمثلة على ذلك هو الاستخراج من تقارير وكالات الأنباءمن عمليات الدمج بين الشركات، كما توضح العلاقة التالية:

دمج_بين(الشركة_1، الشركة_2، تاريخ)،

من الجملة الأخبارية على الإنترنت مثل:

امس، أعلنت شركة غزل النسيج المحدودة عن حصولها على شركة الاقطان العربية.

الهدف الاشمل لعملية استخراج المعلومات هو السماح للمعالجة الحاسوبية ان تتم سلفا على البيانات غير الهيكلية. وثمة هدف أكثر تحديدا هو السماح للتفكير المنطقي أن يقوم بالاستدلال على أساس المحتوى المنطقي للبيانات المدخلة. البيانات الهيكلية هي بيانات واضحة المعالم دلاليا من المجال المختار، تم تفسيره بدقة وعناية وفقا للتصنيف والسياق.

تاريخ استخراج المعلومات

استخراج المعلومات يعود إلى أواخر 1970s في الأيام الأولى من معالجة اللغات الطبيعية.[2] وكان أول نظام تجاري من منتصف 1980s هو «جاسبر» وتم بناءه لرويترز عبر مجموعة كارنيجي بهدف تقديم الأخبار المالية في وقت نشرها للتجار المنافسين. [3]

انظر أيضا

المراجع

  1. معجم البيانات والذكاء الاصطناعي (PDF) (بالعربية والإنجليزية)، الهيئة السعودية للبيانات والذكاء الاصطناعي، 2022، ص. 77، QID:Q111421033
  2. Peggy M. Andersen؛ وآخرون. "Automatic Extraction of Facts from Press Releases to Generate News Stories" (PDF). مؤرشف من الأصل (PDF) في 2008-11-19. {{استشهاد ويب}}: Explicit use of et al. in: |مؤلف= (مساعدة)
  3. Jim Cowie and Yorick Wilks. "Information Extraction". مؤرشف من الأصل في 2012-10-07.
  • أيقونة بوابةبوابة لسانيات
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.