إلزامي عند تعيين قائمة index_tokclass_fields. ملخص للمناطق التي يجب تخزينها في DocStore، مما يعني إمكانية استرجاعها لاحقًا، ولكن يتم سرد الرسائل النصية الكاملة، وبالتالي لن تكون قابلة للبحث من خلال عبارة Matches(). ملخص للمناطق التي يجب أن تكون مفصلة نصيًا بالكامل ومخزنة داخل DocStore، مما يوفر استرجاعًا لاحقًا لمحتوى الحقل الجديد مع استعلامات Matches(). سيستهلك فهرس RT بقيمة بحث تبلغ 3 ميجابايت فقط تلك الـ 3 ميجابايت الفعلية من ذاكرة الوصول العشوائي، حتى عند محاولة تعيين rt_mem_restriction إلى 100 جيجابايت.
توجيه join_schema
ليست مفيدة جدًا بحد ذاتها، إنما تعني فقط أن استخدام GROUPBY() لا يؤثر على نوع سطر المجموعة الجذرية. وكما هو الحال في SQL العادي، يتم تفعيلها عند وجود ميزات تجميعية في الاستعلام. ستُعطي الاستعلامات القليلة التالية نتائج مماثلة، باستثناء وجود عمود grp إضافي في كل استعلام تقريبًا. مجموعات التأثيرات ليست غير محدودة، والحد 20 هو الحد الضمني الافتراضي.
إليك مثال جيد لملف XML يمكنك بالتأكيد استخدامه مع Sphinx. كما يمكنك تضمين عملية حذف دفعات (k-batch) في نفس تدفق XML مع مستنداتك. يتطلب Sphinx عددًا تسجيل الدخول megawin تسجيل الدخول من تسميات XML الفريدة لمساعدتك في تمييز البيانات الفردية. حاليًا، لا يمكنك تجاهل أعمدة CSV. ببساطة، يمكنك "إعادة ترتيب" أعمدة CSV عبر csvpipe_header.
توجيه unpack_zlib
علاوة على ذلك، فإنّ rank_industries سهل الاستخدام للغاية. تستمرّ الميزات التكميلية بالعمل كالمعتاد. يتمّ فقط احتساب تكرارات الكلمات المفتاحية من تصنيف الصناعات المُصنّفة عند حساب نقاط الترتيب. يأتي rank_industries لاحقًا. تختلف أحدث قيم BM25 كما هو متوقع، لأنّ المتوسطات الديناميكية في rt1 تختلف عن المتوسطات الثابتة في rt2، ولكن هذا ما يحدث بعد بضعة صفوف إضافية. إليك مثال جيّد يحتوي على عنكبوتين، rt1 وrt2، حيث يختلف الثاني فقط بسبب السماح بـ global_avg_field_lengths. ضع في اعتبارك حقول النظام التي لا ينبغي تصنيفها.

يتم تجميع عدادات الصفوف الجديدة من جميع الخوادم داخل الدليل الموزع، عبر جميع برامج الزحف الجديدة (RT أو الأساسية). بما في ذلك، داخل قائمة تحتوي على مجالين (المصطلح والمحتوى)، نحصل على هذه العدادات. يتم إرجاع بعضها كقيم رقمية أو نصية فردية، بينما يتم تسمية البعض الآخر بها، ويمكن تنسيقها لاحقًا كمستندات JSON صغيرة، للاستفادة منها. تعرض الشاشات بعض العدادات لكل فهرس، أي لكل عداد "جدول" (نماذج في المستندات، والبايتات، والإحصائيات، وما إلى ذلك). على الرغم من ذلك، يجب أن تكون وحدة مفيدة لعرض تكوينات الفهرس أثناء التشغيل، حيث أنها تتجاهل أي خيارات غير قياسية. ينشئ هذا البيان تقرير جدول مطابقًا لمخطط وإعداد قائمة الرسائل النصية الكاملة المقدمة.
البحث عن بناء الجملة
لدينا الآن الملف #dos وهو مناسب، وهذا جيد، ولكن لماذا يحتل المستند الأحدث #step three مرتبة عالية فجأة؟ المطابقة الذكية (Matching-smart) تُجري عملية بحث منطقية تقليدية باستخدام عامل "أو" (Or) لعدة كلمات، ولكن الترتيب الذكي (Range-smart) (على عكس عامل "وإلا" التقليدي) لا يزيد من ترتيب الكلمات داخل الاستعلام. يُمكّنك عامل "أو" (Turn-Tub) من تحديد مرادفات "مرتبة بشكل صحيح" لكل كلمة بحث في مخرجات الاستعلام. وبالتالي، فهو يُطابق البيانات #dos و#3. السؤال #1 يُطابق الملف #step one فقط، فلا مفاجأة في ذلك. قد يُسبب هذا أحيانًا بعض الصعوبة في الفهم، وقد تحصل على نتيجة مطابقة غير متوقعة (لكنها حتمية!).
لتعطيل ذاكرة التخزين المؤقت للاستعلام، اضبط حد حجمها (akaqcache_max_bytes) على 0. وبالفعل، عند استخدام موارد أقل من 810 نظامًا، يمكننا ملاحظة انخفاض في استهلاك الموارد، واكتشاف أسرع للمطابقات، وتلقي تحذيرات إنهاء مبكرة، كما هو متوقع. سيكلفك الاستعلام التجريبي 810 نظامًا مقارنةً بإعداداتك القياسية. مع الأسف، يختلف أداء الاستعلام مقابل معدل الاستدعاء بشكل كبير بين مجموعات البيانات والاستعلامات.
البحث: ذكريات وخطط إنفاق
في اختبار بسيط وسهل باستخدام DirtyBenchmark الإصدار 3.4 (إعدادات بحث قياسية؛ خادم ذو 96 نواة؛ 128 عضوًا يقومون بعمليات تحديد المناطق)، حققتُ حوالي 110 ألف طلب في الثانية باستخدام خيط واحد. يقتصر عداد `fetched_docs` على حساب الصفوف الناتجة فقط، وذلك للحد من إجمالي عدد عمليات البحث. لذا، في أفضل الأحوال (مع تفعيل جميع عوامل تصفية Where)، ستُرجع الاستعلامات الجديدة N صفًا، وليس صفًا واحدًا إضافيًا. بالنسبة لعمليات البحث غير القائمة على الأسماء، يتم حساب جميع الصفوف النشطة (الفريدة) التي تمت مطابقتها (إما من خلال فهم قائمة الخصائص، أو من خلال مسح كامل).

في الواقع، ربما يكون أحد أشهر تماثيل أبو الهول هو تمثال دلفي؛ الذي يبلغ طوله حوالي 10 أمتار، وقد بناه الناكسيون في معبدهم الجديد حتى عام 560 قبل الميلاد. في الألفية السادسة قبل الميلاد، ظهر تمثال أبو الهول اليوناني الجديد في صورة منحوتة من الحجر، ربما بجزء خلفي مرتفع. توجد أمثلة على تماثيل أبو الهول ذات وجه بشري محاط بعرف أسد، كما هو الحال في النوبة، وفي الإمبراطورية الرومانية الجديدة، يُشبه الرأس إما رأس كبش أو رأس الإله آمون.
لذلك، يتم حسابها مرة واحدة فقط، منذ البداية بعيدًا عن معالجة الاستعلام. كما أنها لا تُحلل تلقائيًا. وللتدقيق في شكل المثال، لاحظ أن…
توجد عمليات الربط في ملف نصي منفصل (أو مجموعة ملفات)، ويمكن استخدامها في الفهرس الجديد الذي يحتوي على توجيه ربط ممتاز. يشير السطر "جديد" إلى أن هذا النوع من الربط متاح الآن، ولكنه لم يكن مدعومًا بتوجيه Wordforms القديم الجديد. على عكس التوجيهات العامة، التي تؤثر على الملفات والاستعلامات الأخرى.

