عند العمل مع LLM ، ستصادف الكثير من المصطلحات الجديدة. سيساعدك هذا القسم على فهم معنى هذه المصطلحات وكيفية استخدامها في سياق ماجستير القانون.
- التعلم الآلي (ML) — ML هو مجال دراسة يركز على الخوارزميات التي يمكنها التعلم من البيانات. ML هو مجال فرعي من الذكاء الاصطناعي.
- "النموذج" مقابل "الذكاء الاصطناعي" مقابل "LLM" — تُستخدم هذه المصطلحات بشكل متبادل إلى حد ما طوال هذه الدورة، لكنها لا تعني دائمًا نفس الشيء. ماجستير القانون هو نوع من الذكاء الاصطناعي، كما هو مذكور أعلاه، ولكن ليس كل الذكاء الاصطناعي ماجستير قانون. عندما ذكرنا النماذج في هذه الدورة، فإننا نشير إلى نماذج الذكاء الاصطناعي. على هذا النحو، في هذه الدورة، يمكنك اعتبار مصطلحي "النموذج" و"الذكاء الاصطناعي" قابلين للتبادل.
- LLM — نموذج اللغة الكبير. نموذج اللغة الكبير هو نوع من الذكاء الاصطناعي الذي يمكنه فهم وإنشاء نص يشبه الإنسان بناءً على المدخلات التي يتلقاها. تم تدريب هذه النماذج على كميات هائلة من بيانات النصوص ويمكنها تنفيذ مجموعة واسعة من المهام المتعلقة باللغة، مثل الإجابة على الأسئلة وإجراء المحادثات وتلخيص النصوص وترجمة اللغات وغير ذلك الكثير.
- MLM — نموذج اللغة المقنعة. نموذج اللغة المقنعة هو نوع من نماذج اللغة التي يتم تدريبها للتنبؤ بالكلمة التالية في تسلسل الكلمات. يتم تدريبه عادةً على مجموعة كبيرة من بيانات النصوص ويمكن استخدامه لمجموعة متنوعة من المهام، مثل الترجمة الآلية وتحليل المشاعر والتلخيص والمزيد.
- NLP — معالجة اللغة الطبيعية. معالجة اللغة الطبيعية هي فرع من فروع الذكاء الاصطناعي الذي يتعامل مع التفاعل بين أجهزة الكمبيوتر واللغات البشرية. يتم استخدامها لتحليل وفهم وتوليد اللغة البشرية.
- التسمية — العلامات هي مجرد احتمالات لتصنيف نص معين. على سبيل المثال، إذا كان لديك نص يقول "أحبك"، فيمكن أن تكون العلامات "إيجابية" أو "سلبية" أو "محايدة". سيحاول النموذج التنبؤ بالعلامة الأكثر احتمالاً أن تكون صحيحة بناءً على النص المدخل.
- مساحة التسمية — مساحة التسمية هي مجموعة من كل التسميات المحتملة التي يمكن تخصيصها لنص معين. على سبيل المثال، إذا كان لديك نص يقول "أحبك"، فيمكن أن تكون مساحة التسمية "إيجابية" أو "سلبية" أو "محايدة".
- توزيع العلامات — توزيع العلامات هو توزيع الاحتمالات على مساحة العلامات. على سبيل المثال، إذا كان لديك نص يقول "أحبك"، فيمكن أن يكون توزيع العلامات [0.8، 0.1، 0.1]. وهذا يعني أن النموذج يعتقد أن هناك فرصة بنسبة 80% أن يكون النص إيجابيًا، وفرصة بنسبة 10% أن يكون سلبيًا، وفرصة بنسبة 10% أن يكون محايدًا.
- تحليل المشاعر — تحليل المشاعر هو عملية تحديد النبرة العاطفية وراء سلسلة من الكلمات، والتي تُستخدم لفهم المواقف والآراء والعواطف المعبر عنها في ذكر عبر الإنترنت. يُعرف تحليل المشاعر أيضًا باسم استخراج الرأي، وهو يستنتج رأي أو موقف المتحدث.
- المعبر اللفظي — في إعداد التصنيف، المعبر اللفظي عبارة عن تعيينات من العلامات إلى الكلمات في مفردات نموذج اللغة.
- التعلم التعزيزي من ردود الفعل البشرية (RLHF) — RLHF هي تقنية لتدريب نموذج لأداء مهمة من خلال تزويده بردود فعل بشرية. تم تدريب النموذج لتحقيق أقصى قدر من ردود الفعل الإيجابية التي يتلقاها من البشر، مع تقليل كمية ردود الفعل السلبية التي يتلقاها.