2024 ผู้เขียน: Howard Calhoun | [email protected]. แก้ไขล่าสุด: 2023-12-17 10:42
คนยุคใหม่จะจินตนาการถึงชีวิตโดยปราศจากอินเทอร์เน็ตได้ยาก และเข้าถึงแหล่งข้อมูลได้แทบจะในทันที ผู้ใช้ไม่ค่อยคิดว่าการค้นหาเนื้อหาที่ต้องการบนเครือข่ายดำเนินการอย่างไร แต่นี่น่าสนใจมาก
ระบบดึงข้อมูล (IPS) เป็นระบบซอฟต์แวร์และฮาร์ดแวร์ที่ซับซ้อนซึ่งเลือกข้อมูลตามคำขอของผู้ใช้ ข้อมูลถูกเก็บไว้ในเซิร์ฟเวอร์ในรูปแบบดิจิทัล เนื่องจากหนังสือเคยอยู่บนชั้นวางของห้องสมุด ระบบประกอบด้วยระบบย่อยจำนวนมาก แต่ละคนทำงานของตนในกระบวนการประมวลผลคำขอของผู้ใช้และให้ข้อมูลในรูปแบบข้อความหรือเสียงแก่เขา หลายหลากของงานที่จะแก้ไขกำหนดความซับซ้อนของสถาปัตยกรรมของระบบการดึงข้อมูลที่ทันสมัย (ตัวย่อของระบบการดึงข้อมูล) ชนิดของ "กล่องดำ": ที่อินพุต - ข้อความของคำขอ สิ่งที่อยู่ภายใน - ไม่เป็นที่รู้จัก ที่เอาต์พุต - ข้อมูลที่ครอบคลุม
อินพุตสตรีม
ขอข้อมูลที่บุคคลสร้างในรูปแบบข้อความบนหน้าจอของอุปกรณ์ของเขาถือเป็นส่วนเล็กๆ ของคำขอที่ประมวลผลโดยเครื่องมือค้นหา อาร์เรย์หลักของข้อความค้นหาถูกสร้างขึ้นโดยโรบ็อตที่ยอมรับคำขอของมนุษย์ และทำการค้นหาแบบหลายขั้นตอนและข้อเสนอแนะกับผู้ใช้ ระบบดึงข้อมูลรวมถึง Google, Yandex และอื่นๆ ที่เป็นที่รู้จัก ประมวลผลคำขอนับล้านทุกวัน
วัตถุค้นหาที่มา
ชุดของวัตถุเริ่มต้นที่น่าสนใจสำหรับการค้นหา ได้แก่ เอกสาร บันทึก วิดีโอ รูปภาพ และอื่นๆ พวกมันถูกสร้างขึ้นนอก IPS ระบบการจัดเก็บและดึงข้อมูลทั่วไปควรมีระบบบรรณานุกรมในตัว ซึ่งเป็นแคตตาล็อกประเภทหนึ่งที่ช่วยให้คุณสามารถค้นหาวัตถุชนิดใดก็ได้
อ็อบเจ็กต์หรือการแปลงแบบดิจิทัลกลายเป็น "แหล่งข้อมูล" ใน IPS เป็นหนึ่งในนั้นที่มีการเลือกข้อมูลที่ผู้ใช้ต้องการ
แหล่งภายนอก
มุมมองการเลือกข้อมูลใช้แหล่งความรู้ภายนอก นี่คือข้อมูลที่ผู้ใช้กำลังมองหา ชื่อภาพยนตร์ คำพูดจากหนังสือ และอื่นๆ สำหรับการค้นหาด้วยคอมพิวเตอร์ ข้อมูลนี้ต้องได้รับการแปลเป็นแบบสอบถามในภาษาอัลกอริธึม ใน IPS ทำได้โดยใช้บล็อกสำหรับสร้าง จัดทำดัชนี และพัฒนาคิวรี
ตามหลักการแล้ว กระบวนการทั้งสามนี้-การเป็นตัวแทน การจัดทำดัชนี และการพัฒนาการสืบค้น-ควรอาศัยแหล่งความรู้ที่เหมือนกัน แต่ในทางปฏิบัติ ไม่สามารถทำได้
แหล่งความรู้ควรได้รับการตรวจสอบและปรับปรุงอย่างต่อเนื่อง และการปรับปรุงควรเหมือนกันและซิงโครไนซ์ และแหล่งความรู้ภายนอกมักจะมาก่อนการใช้งานในเครื่องมือค้นหาสำหรับข้อความค้นหา ซึ่งบางครั้งอาจใช้เวลาหลายปี
การแสดง
การเป็นตัวแทนของวัตถุดั้งเดิมนั้นประกอบด้วยข้อมูลที่ป้อนในการผสมผสานหรือแปลงตามกฎและอัลกอริธึมของระบบดึงข้อมูลเฉพาะ
จำนวนการดูคือสำเนาของออบเจ็กต์การค้นหาดั้งเดิมที่แปลงสภาพไม่มากก็น้อย ในคอลเลกชั่นของข้อความฉบับเต็มที่ไม่มีการแก้ไข แต่ละข้อความเป็นตัวแทนของตัวเอง ในคอลเล็กชั่นวัตถุของนิทรรศการและสิ่งประดิษฐ์ในพิพิธภัณฑ์ การนำเสนอสามารถปรับเปลี่ยนคำอธิบายของวัตถุด้วยรูปภาพได้ ในบางกรณี การนำเสนออาจมาจากวัตถุดั้งเดิมบางส่วนและส่วนหนึ่งมาจากคำอธิบาย: ในเครื่องมือค้นหาบรรณานุกรม การแสดงแทนได้มาจากวัตถุนั้น - ตัวอย่างเช่น ชื่อเรื่อง ชื่อผู้แต่งจะถูกรวมเข้ากับคำอธิบายประกอบของงาน
ดัชนีที่ค้นหาได้
เนื่องจากข้อมูลในระบบการดึงข้อมูลถูกจัดเก็บไว้ในรูปแบบของการแสดงแทน จึงมีเหตุผลที่จะถือว่าการค้นหาดำเนินการตามการแสดงข้อมูล และหลังจากเลือกแล้ว ผู้ใช้จะได้รับ ในทางปฏิบัติ นี่ไม่ใช่กรณี ตัวอย่างเช่น แค็ตตาล็อกห้องสมุดออนไลน์ในปัจจุบันมักจำกัดการค้นหาไว้เฉพาะบางฟิลด์: ผู้แต่ง ชื่อเรื่อง และคำบรรยายภายในมุมมองที่มีฟิลด์อื่นที่ไม่ได้ค้นหา นี่เป็นเหตุผลเพียงพอว่าทำไมจึงจำเป็นต้องแยกแยะมุมมองและดัชนีที่ค้นหาได้ ซึ่งเป็นส่วนการค้นหาของมุมมอง มันกำหนดทุกอย่างที่ควรค้นหาได้ ดัชนีที่ค้นหาได้ เช่น มุมมองและออบเจ็กต์ต้นทาง สามารถแบ่งออกเป็นดัชนีย่อยแยกกันเพื่อให้การค้นหาที่ตรงเป้าหมายและแม่นยำยิ่งขึ้น
เครื่องมือค้นหามักจะมีโครงสร้างสังเคราะห์ภายในเพื่อจับคู่ผลการค้นหาที่ถูกต้อง โครงสร้างนี้เป็นองค์ประกอบที่สองของดัชนีที่ค้นหาได้
ตามขั้นตอน กระบวนการสร้างดัชนีสามารถดำเนินการได้หลายวิธี: สามารถรับดัชนีที่ค้นหาได้โดย:
- การคัดลอกการแสดงที่ค้นหาได้อย่างแท้จริง
- โดยคัดลอกรายละเอียดการดู นี่อาจเป็นมุมมองบางส่วนหรือทั้งหมดที่มีอยู่จริงเป็นส่วนย่อย กระจายตามกฎสำหรับการสร้างดัชนีสำหรับการค้นหา ซึ่งจะถูกรวบรวมเมื่อจำเป็น
ขอกฎการออกแบบและคำขออย่างเป็นทางการ
วิศวกรรมการสืบค้นเป็นฟังก์ชันที่ทำหน้าที่เป็นสื่อกลางระหว่างข้อความค้นหาของผู้ใช้กับข้อความค้นหาที่เป็นทางการ โดยจะแปลงการสืบค้นของผู้ใช้ โดยจับคู่กับพจนานุกรมคำสั่งการดึงข้อมูล ข้อมูลจำเพาะของดัชนี และดัชนีก่อนการดึงข้อมูล ในช่วงเริ่มต้นของการพัฒนา IPS บทบาทนี้ถูกกำหนดให้กับผู้เชี่ยวชาญด้านไอทีที่มีคุณสมบัติตามธรรมเนียม
การพัฒนาคำค้นหาในคอมพิวเตอร์ที่สามารถจับคู่คำค้นหาจากพจนานุกรมในระบบดัชนีที่ค้นหาได้นั้นโดยทั่วไปจะเรียกว่าโมดูล "อินพุตพจนานุกรม"การทำงานอัตโนมัติของฟังก์ชันนี้มีแนวโน้มดีและมีโอกาสสำหรับวิธีการค้นหาแบบผู้เชี่ยวชาญและความน่าจะเป็น
คำขออย่างเป็นทางการจะกลายเป็นคำขออย่างเป็นทางการหลังจากแปลงคำขอของผู้ใช้แล้ว ตัวอย่างของการแปลงที่เป็นทางการดังกล่าว ได้แก่ การตัดทอน การแทนที่ การทำให้เป็นมาตรฐาน การแปลงเวกเตอร์ และการแปลงอื่น ๆ ของการแทนค่า "ภายนอก" เป็นการแสดงแทน "ภายใน" ของคอมพิวเตอร์ IPS (การถอดรหัส - ระบบดึงข้อมูล)
แยกชุดลิงค์เอกสาร
ชุดผลลัพธ์ของแหล่งข้อมูลเป็นชุดย่อยของมุมมองที่สร้างขึ้นโดยกฎการจับคู่ที่ใช้กับการค้นหาอย่างเป็นทางการโดยดัชนีที่ค้นหาได้
โดยปกติ แต่ไม่จำเป็นว่าจะต้องมีกระบวนการแยกประเภทสำหรับชุดข้อมูลที่กู้คืน แคตตาล็อกห้องสมุดออนไลน์มักจะจัดลำดับชุดที่ได้รับตามลำดับตัวอักษรโดยผู้แต่งก่อนแสดง ในระบบดึงข้อมูลที่สร้างการจัดอันดับที่เข้มงวด ลำดับการจัดลำดับก่อนการเรียงลำดับใหม่ใดๆ
กระแสออก
ผลลัพธ์ของการค้นหาจะทำตามปกติบนจอแสดงผลซึ่งมักจะอยู่ในรูปแบบของสตรีมของวัตถุที่จะใช้ที่อื่นหรือเพื่อวัตถุประสงค์อื่น ๆ ทำให้การค้นหาหลักสมบูรณ์ สตรีมดังกล่าวสามารถส่งไปยังอุปกรณ์แสดงภาพ, ที่เก็บข้อมูลสำหรับการประมวลผลเพิ่มเติม หรือใช้เป็นสตรีมอินพุตไปยังบริการการเลือกอื่นๆ
ระบบดึงข้อมูลให้คำติชมจากผลลัพธ์ของกระบวนการคัดเลือกใดๆ ผลลัพธ์ของกระบวนการใดๆ ก็สามารถย้อนกลับไปยังกระบวนการอื่นๆ ได้ คำติชมสามารถให้พื้นฐานสำหรับการตัดสินใจของผู้เชี่ยวชาญในทุกขั้นตอน
แนะนำ:
น้ำมัน WTI คือ?
น้ำมัน WTI คืออะไร? ความแตกต่างหลักจากน้ำมัน Brent คืออะไร? เหตุใดต้นทุนของวัตถุดิบที่เหลือในการค้าโลกจึงกำหนดโดยเกรดเหล่านี้ แบรนด์ใดต่อไปนี้มีราคาแพงกว่าและเพราะเหตุใด ราคาน้ำมันวันนี้เป็นอย่างไรและคาดการณ์ปี 2562 อย่างไร?
เจ้าหน้าที่ Support คือ แนวคิด คำจำกัดความ สภาพการทำงาน และหลักการจ่ายค่าตอบแทน
พนักงานในองค์กรแบ่งเป็นพนักงานหลักและสายสนับสนุน ต่างจากเจ้าหน้าที่สนับสนุนหลัก พวกเขาทำหน้าที่ที่ไม่เกี่ยวข้องกับกิจกรรมหลักของบริษัท บทความกล่าวถึงคุณสมบัติและลักษณะของเจ้าหน้าที่สนับสนุน
BKI คือ แนวคิด คำจำกัดความ บริการที่มีให้ การตรวจสอบ การสร้างและการประมวลผลประวัติเครดิตของคุณ
BKI เป็นองค์กรการค้าที่รวบรวมและประมวลผลข้อมูลเกี่ยวกับผู้กู้ ข้อมูลจากบริษัทช่วยให้ผู้ให้กู้ทราบว่ามีความเสี่ยงใด ๆ ในการให้กู้ยืมแก่บุคคลธรรมดาหรือไม่ จากข้อมูลที่ได้รับเกี่ยวกับลูกค้า ธนาคารจึงตัดสินใจอนุมัติหรือปฏิเสธสินเชื่อผู้บริโภค
สหพันธ์เจ้าของรถยนต์แห่งรัสเซีย (FAR) คือ คำจำกัดความ ประวัติองค์กร กิจกรรม บทวิจารณ์
FAR เป็นบริษัทที่รวมองค์กรสิทธิมนุษยชนด้านรถยนต์และกลุ่มเคลื่อนไหวเพื่อรวมพลังเพื่อปกป้องสิทธิ์ของเจ้าของรถในรัสเซีย ก่อตั้งเมื่อปี พ.ศ. 2549 หากคุณถอดรหัสคำย่อ FAR คุณจะได้รับ "Federation of Motorists of Russia"
CPI คือ ทะเบียน ภาษี ข้อดีข้อเสีย
บางทีวันนี้เกือบทุกคนคิดที่จะเริ่มต้นธุรกิจของตัวเอง แต่มีความรู้น้อยในเรื่องนี้และผู้คนก็ไม่รู้ว่าจะเปิดธุรกิจของตัวเองอย่างไร รูปแบบธุรกิจที่พบบ่อยที่สุดรูปแบบหนึ่งคือ เกี่ยวกับเขาที่จะกล่าวถึงด้านล่าง