IPS คือ วัตถุประสงค์และหน้าที่ของระบบสืบค้นข้อมูล
IPS คือ วัตถุประสงค์และหน้าที่ของระบบสืบค้นข้อมูล

วีดีโอ: IPS คือ วัตถุประสงค์และหน้าที่ของระบบสืบค้นข้อมูล

วีดีโอ: IPS คือ วัตถุประสงค์และหน้าที่ของระบบสืบค้นข้อมูล
วีดีโอ: บุกโรงงานมักกะสัน Ep.2 ชมหัวรถจักรและรถอีกหลายๆรุ่นที่จอดอยู่ในโรงงาน 2024, พฤศจิกายน
Anonim

คนยุคใหม่จะจินตนาการถึงชีวิตโดยปราศจากอินเทอร์เน็ตได้ยาก และเข้าถึงแหล่งข้อมูลได้แทบจะในทันที ผู้ใช้ไม่ค่อยคิดว่าการค้นหาเนื้อหาที่ต้องการบนเครือข่ายดำเนินการอย่างไร แต่นี่น่าสนใจมาก

ระบบดึงข้อมูล (IPS) เป็นระบบซอฟต์แวร์และฮาร์ดแวร์ที่ซับซ้อนซึ่งเลือกข้อมูลตามคำขอของผู้ใช้ ข้อมูลถูกเก็บไว้ในเซิร์ฟเวอร์ในรูปแบบดิจิทัล เนื่องจากหนังสือเคยอยู่บนชั้นวางของห้องสมุด ระบบประกอบด้วยระบบย่อยจำนวนมาก แต่ละคนทำงานของตนในกระบวนการประมวลผลคำขอของผู้ใช้และให้ข้อมูลในรูปแบบข้อความหรือเสียงแก่เขา หลายหลากของงานที่จะแก้ไขกำหนดความซับซ้อนของสถาปัตยกรรมของระบบการดึงข้อมูลที่ทันสมัย (ตัวย่อของระบบการดึงข้อมูล) ชนิดของ "กล่องดำ": ที่อินพุต - ข้อความของคำขอ สิ่งที่อยู่ภายใน - ไม่เป็นที่รู้จัก ที่เอาต์พุต - ข้อมูลที่ครอบคลุม

ไฟล์การ์ดในชีวิตจริง
ไฟล์การ์ดในชีวิตจริง

อินพุตสตรีม

ขอข้อมูลที่บุคคลสร้างในรูปแบบข้อความบนหน้าจอของอุปกรณ์ของเขาถือเป็นส่วนเล็กๆ ของคำขอที่ประมวลผลโดยเครื่องมือค้นหา อาร์เรย์หลักของข้อความค้นหาถูกสร้างขึ้นโดยโรบ็อตที่ยอมรับคำขอของมนุษย์ และทำการค้นหาแบบหลายขั้นตอนและข้อเสนอแนะกับผู้ใช้ ระบบดึงข้อมูลรวมถึง Google, Yandex และอื่นๆ ที่เป็นที่รู้จัก ประมวลผลคำขอนับล้านทุกวัน

วัตถุค้นหาที่มา

ชุดของวัตถุเริ่มต้นที่น่าสนใจสำหรับการค้นหา ได้แก่ เอกสาร บันทึก วิดีโอ รูปภาพ และอื่นๆ พวกมันถูกสร้างขึ้นนอก IPS ระบบการจัดเก็บและดึงข้อมูลทั่วไปควรมีระบบบรรณานุกรมในตัว ซึ่งเป็นแคตตาล็อกประเภทหนึ่งที่ช่วยให้คุณสามารถค้นหาวัตถุชนิดใดก็ได้

อ็อบเจ็กต์หรือการแปลงแบบดิจิทัลกลายเป็น "แหล่งข้อมูล" ใน IPS เป็นหนึ่งในนั้นที่มีการเลือกข้อมูลที่ผู้ใช้ต้องการ

ค้นหาข้อมูล
ค้นหาข้อมูล

แหล่งภายนอก

มุมมองการเลือกข้อมูลใช้แหล่งความรู้ภายนอก นี่คือข้อมูลที่ผู้ใช้กำลังมองหา ชื่อภาพยนตร์ คำพูดจากหนังสือ และอื่นๆ สำหรับการค้นหาด้วยคอมพิวเตอร์ ข้อมูลนี้ต้องได้รับการแปลเป็นแบบสอบถามในภาษาอัลกอริธึม ใน IPS ทำได้โดยใช้บล็อกสำหรับสร้าง จัดทำดัชนี และพัฒนาคิวรี

ตามหลักการแล้ว กระบวนการทั้งสามนี้-การเป็นตัวแทน การจัดทำดัชนี และการพัฒนาการสืบค้น-ควรอาศัยแหล่งความรู้ที่เหมือนกัน แต่ในทางปฏิบัติ ไม่สามารถทำได้

แหล่งความรู้ควรได้รับการตรวจสอบและปรับปรุงอย่างต่อเนื่อง และการปรับปรุงควรเหมือนกันและซิงโครไนซ์ และแหล่งความรู้ภายนอกมักจะมาก่อนการใช้งานในเครื่องมือค้นหาสำหรับข้อความค้นหา ซึ่งบางครั้งอาจใช้เวลาหลายปี

ระบบสืบค้นข้อมูล
ระบบสืบค้นข้อมูล

การแสดง

การเป็นตัวแทนของวัตถุดั้งเดิมนั้นประกอบด้วยข้อมูลที่ป้อนในการผสมผสานหรือแปลงตามกฎและอัลกอริธึมของระบบดึงข้อมูลเฉพาะ

จำนวนการดูคือสำเนาของออบเจ็กต์การค้นหาดั้งเดิมที่แปลงสภาพไม่มากก็น้อย ในคอลเลกชั่นของข้อความฉบับเต็มที่ไม่มีการแก้ไข แต่ละข้อความเป็นตัวแทนของตัวเอง ในคอลเล็กชั่นวัตถุของนิทรรศการและสิ่งประดิษฐ์ในพิพิธภัณฑ์ การนำเสนอสามารถปรับเปลี่ยนคำอธิบายของวัตถุด้วยรูปภาพได้ ในบางกรณี การนำเสนออาจมาจากวัตถุดั้งเดิมบางส่วนและส่วนหนึ่งมาจากคำอธิบาย: ในเครื่องมือค้นหาบรรณานุกรม การแสดงแทนได้มาจากวัตถุนั้น - ตัวอย่างเช่น ชื่อเรื่อง ชื่อผู้แต่งจะถูกรวมเข้ากับคำอธิบายประกอบของงาน

ค้นหาสิ่งที่คุณต้องการ
ค้นหาสิ่งที่คุณต้องการ

ดัชนีที่ค้นหาได้

เนื่องจากข้อมูลในระบบการดึงข้อมูลถูกจัดเก็บไว้ในรูปแบบของการแสดงแทน จึงมีเหตุผลที่จะถือว่าการค้นหาดำเนินการตามการแสดงข้อมูล และหลังจากเลือกแล้ว ผู้ใช้จะได้รับ ในทางปฏิบัติ นี่ไม่ใช่กรณี ตัวอย่างเช่น แค็ตตาล็อกห้องสมุดออนไลน์ในปัจจุบันมักจำกัดการค้นหาไว้เฉพาะบางฟิลด์: ผู้แต่ง ชื่อเรื่อง และคำบรรยายภายในมุมมองที่มีฟิลด์อื่นที่ไม่ได้ค้นหา นี่เป็นเหตุผลเพียงพอว่าทำไมจึงจำเป็นต้องแยกแยะมุมมองและดัชนีที่ค้นหาได้ ซึ่งเป็นส่วนการค้นหาของมุมมอง มันกำหนดทุกอย่างที่ควรค้นหาได้ ดัชนีที่ค้นหาได้ เช่น มุมมองและออบเจ็กต์ต้นทาง สามารถแบ่งออกเป็นดัชนีย่อยแยกกันเพื่อให้การค้นหาที่ตรงเป้าหมายและแม่นยำยิ่งขึ้น

เครื่องมือค้นหามักจะมีโครงสร้างสังเคราะห์ภายในเพื่อจับคู่ผลการค้นหาที่ถูกต้อง โครงสร้างนี้เป็นองค์ประกอบที่สองของดัชนีที่ค้นหาได้

ตามขั้นตอน กระบวนการสร้างดัชนีสามารถดำเนินการได้หลายวิธี: สามารถรับดัชนีที่ค้นหาได้โดย:

  • การคัดลอกการแสดงที่ค้นหาได้อย่างแท้จริง
  • โดยคัดลอกรายละเอียดการดู นี่อาจเป็นมุมมองบางส่วนหรือทั้งหมดที่มีอยู่จริงเป็นส่วนย่อย กระจายตามกฎสำหรับการสร้างดัชนีสำหรับการค้นหา ซึ่งจะถูกรวบรวมเมื่อจำเป็น
การจัดการการค้นหา
การจัดการการค้นหา

ขอกฎการออกแบบและคำขออย่างเป็นทางการ

วิศวกรรมการสืบค้นเป็นฟังก์ชันที่ทำหน้าที่เป็นสื่อกลางระหว่างข้อความค้นหาของผู้ใช้กับข้อความค้นหาที่เป็นทางการ โดยจะแปลงการสืบค้นของผู้ใช้ โดยจับคู่กับพจนานุกรมคำสั่งการดึงข้อมูล ข้อมูลจำเพาะของดัชนี และดัชนีก่อนการดึงข้อมูล ในช่วงเริ่มต้นของการพัฒนา IPS บทบาทนี้ถูกกำหนดให้กับผู้เชี่ยวชาญด้านไอทีที่มีคุณสมบัติตามธรรมเนียม

การพัฒนาคำค้นหาในคอมพิวเตอร์ที่สามารถจับคู่คำค้นหาจากพจนานุกรมในระบบดัชนีที่ค้นหาได้นั้นโดยทั่วไปจะเรียกว่าโมดูล "อินพุตพจนานุกรม"การทำงานอัตโนมัติของฟังก์ชันนี้มีแนวโน้มดีและมีโอกาสสำหรับวิธีการค้นหาแบบผู้เชี่ยวชาญและความน่าจะเป็น

คำขออย่างเป็นทางการจะกลายเป็นคำขออย่างเป็นทางการหลังจากแปลงคำขอของผู้ใช้แล้ว ตัวอย่างของการแปลงที่เป็นทางการดังกล่าว ได้แก่ การตัดทอน การแทนที่ การทำให้เป็นมาตรฐาน การแปลงเวกเตอร์ และการแปลงอื่น ๆ ของการแทนค่า "ภายนอก" เป็นการแสดงแทน "ภายใน" ของคอมพิวเตอร์ IPS (การถอดรหัส - ระบบดึงข้อมูล)

แยกชุดลิงค์เอกสาร

ชุดผลลัพธ์ของแหล่งข้อมูลเป็นชุดย่อยของมุมมองที่สร้างขึ้นโดยกฎการจับคู่ที่ใช้กับการค้นหาอย่างเป็นทางการโดยดัชนีที่ค้นหาได้

โดยปกติ แต่ไม่จำเป็นว่าจะต้องมีกระบวนการแยกประเภทสำหรับชุดข้อมูลที่กู้คืน แคตตาล็อกห้องสมุดออนไลน์มักจะจัดลำดับชุดที่ได้รับตามลำดับตัวอักษรโดยผู้แต่งก่อนแสดง ในระบบดึงข้อมูลที่สร้างการจัดอันดับที่เข้มงวด ลำดับการจัดลำดับก่อนการเรียงลำดับใหม่ใดๆ

การวิเคราะห์ข้อมูล
การวิเคราะห์ข้อมูล

กระแสออก

ผลลัพธ์ของการค้นหาจะทำตามปกติบนจอแสดงผลซึ่งมักจะอยู่ในรูปแบบของสตรีมของวัตถุที่จะใช้ที่อื่นหรือเพื่อวัตถุประสงค์อื่น ๆ ทำให้การค้นหาหลักสมบูรณ์ สตรีมดังกล่าวสามารถส่งไปยังอุปกรณ์แสดงภาพ, ที่เก็บข้อมูลสำหรับการประมวลผลเพิ่มเติม หรือใช้เป็นสตรีมอินพุตไปยังบริการการเลือกอื่นๆ

ระบบดึงข้อมูลให้คำติชมจากผลลัพธ์ของกระบวนการคัดเลือกใดๆ ผลลัพธ์ของกระบวนการใดๆ ก็สามารถย้อนกลับไปยังกระบวนการอื่นๆ ได้ คำติชมสามารถให้พื้นฐานสำหรับการตัดสินใจของผู้เชี่ยวชาญในทุกขั้นตอน

แนะนำ:

ตัวเลือกของบรรณาธิการ

ตะกร้าสกุลเงินคู่ในคำง่ายๆคือ อัตราของตะกร้าสกุลเงินคู่

เพทาย - มันคืออะไร? ลักษณะการใช้หิน

ที่มาของไก่งวง. ตุรกี (นก): photo

เรือบรรทุกเครื่องบินนิวเคลียร์ของรัสเซียและข้อมูลจำเพาะ

ไก่วางไข่มากที่สุด: คำอธิบายลักษณะ

เครื่องหว่านเมล็ดพืช: ภาพรวม ข้อกำหนด ประเภท และคำวิจารณ์

ทำไม Kinder Surprise ถูกแบนในสหรัฐอเมริกา: ข้อเท็จจริงที่น่าสนใจ

พื้นผิวพลาสม่า: อุปกรณ์และเทคโนโลยีกระบวนการผลิต

ลักษณะงานของช่าง รายละเอียดงานของหัวหน้าช่าง

ถูกเพิกถอนใบอนุญาตธนาคาร - เงินกู้ในกรณีนี้ต้องทำอย่างไร

ไก่อยู่บ้านนานแค่ไหน? ไก่โต้งมีชีวิตอยู่ได้นานแค่ไหน? พันธุ์ไก่

ไก่ Livensky: คำอธิบายลักษณะลักษณะคุณลักษณะเฉพาะ

ช่างแต่งหน้า - ใคร? ช่างแต่งหน้ามืออาชีพ: อบรมหลักสูตร

Rokla รถเข็นไฮดรอลิก: คำอธิบาย อุปกรณ์ และประเภท

ภัตตาคาร - นี่ใคร? จะเป็นภัตตาคารได้อย่างไร?