วันอังคารที่ 18 ธันวาคม พ.ศ. 2555


บทที่ 8 การค้นหาข้อมูลอินเทอร์เน็ต

การค้นหาข้อมูลบนอินเทอร์เน็ต


อินเตอร์เน็ต (Internet) เป็นเครือข่ายคอมพิวเตอร์หนึ่งที่มีบทบาทสำคัญที่สุดในยุคของสังคมข่าวสารในปัจจุบันการสื่อสารผ่านเครือข่ายคอมพิวเตอร์กำลังมีความสำคัญเพิ่มมากขึ้นเป็นลำดับ โดยมีขอบข่ายเชื่อมโยงเกือบทั่วทุกมุมโลก นอกจากนี้ยังเป็นเครือข่ายของเครือข่าย เพราะอินเตอร์เน็ตประกอบด้วย
เครือข่ายย่อยจำนวนมาก เชื่อมเข้าด้วยกัน อินเตอร์เน็ตจึงเป็นเสมือนขุมทองแห่งใหม่เพราะเป็นที่รวมของข้อมูลข่าวสารความรู้ต่าง ๆ ทำให้โลกที่กว้างใหญ่ไพศาลแคบเข้ามาอีก (สุภางค์ กุณวงษ์ และดารารัตน์ จุฬาพันธุ์. 2540 : 39) ประโยชน์ของอินเตอร์เน็ตนั้นมีมากมาย ทั้งทางด้านการศึกษา การบันเทิง การติดต่อสื่อสารทางจดหมาย การซื้อของ หรือสนุกกับการมีเพื่อนใหม่บนอินเตอร์เน็ต บริการค้นข้อมูลบนอินเตอร์เน็ต โดยใช้ search engine ก็เป็นอีกบริการหนึ่งบนอินเตอร์เน็ต (Internet) ที่เราสามารถค้นหาข้อมูลที่เราต้องการได้ (ชฎิล แก้วปลั่ง. 2543 : 3)

ประเภทของการค้นหาข้อมูล
      Seach Engine การค้นหาข้อมูลด้วยคำที่เจาะจง
             Seach Engine เป็นเว็บไซต์ที่ช่วยในการค้นหาข้อมูลโดยใช้โปรแกรมช่วยในการค้นหาที่เรียกว่าRobot ทำหน้าที่รวบรวมข้อมูลเกี่ยวกับเว็บไซต์ในอินเตอร์เน็ตมาเก็บไว้ในฐานข้อมูล ซึ่งการค้นหาข้อมูลรูปแบบนี้จะช่วยให้สามารถค้นหาข้อมูลได้ตรงกับความต้องการเฉพาะได้ระบุคำที่เจาะจงลงไป เพื่อให้โรบอตเป็นตัวช่วยในการค้นหาข้อมูลซึ่งเป็นรูปแบบที่เป็นที่นิยมมาก เช่น http://www.google.com/


Search Directories การค้นหาข้อมูลตามหมวดหมู่
           การค้นหาข้อมูลตามหมวดหมู่โดยมีเว็บไซต์ที่เป้นตัวกลางในการรวบรวมข้อมูลในระบบเครือข่ายอินเตอร์เน็ต โดยจัดข้อมูลเป็นหมวดหมู่
เพื่อให้ผู้ใช้สามารถเลือกข้อมูลตามที่ต้องการได้โดยการจัดหมวดหมู่ของข้อมูลจะจัดตามข้อมุลที่คล้ายกัน หรือเป็นประเภทเดียวกัน นำมารวบรวมไว้ในกลุ่มเดียวกัน
           ลักษณะการค้นหาข้อมูล  Search Directories จะทำให้ผู้ใช้สะดวกในการเลือกข้อมูลที่ต้องการค้นหา และทำให้ได้ข้อมูลตรงกับความต้องการ
           การค้นหาวิธีนี้ มีข้อดีคือ สามารถเลือกจากชื่อไดเร็กทอรี่ส์ที่เกี่ยวข้องกับสิ่งที่ต้องการค้นหา และสามารถที่จะเข้าไปดูว่ามีเว็บไซต์ใด้บ้างได้ทันที
เช่น www.sanook.com  






 การค้นหาโดยใช้ Search Engine
                Keyword Index เป็นการค้นหาข้อมูล โดยการค้นจากข้อความในเว็บเพจที่ได้ผ่านการสำรวจมาแล้ว จะอ่านข้อความ ข้อมูล อย่างน้อยๆ ก็ประมาณ 200-300 ตัวอักษรแรกของเว็บเพจนั้นๆ โดยการอ่านนี้จะหมายรวมไปถึงอ่านข้อความที่อยู่ในโครงสร้างภาษา HTML ซึ่งอยู่ในรูปแบบของข้อความที่อยู่ในคำสั่ง alt ซึ่งเป็นคำสั่งภายใน TAG คำสังของรูปภาพ แต่จะไม่นำคำสั่งของ TAG อื่นๆ ในภาษา HTML และคำสั่งในภาษาJAVA มาใช้ในการค้นหา วิธีการค้นหาของ Search Engine ประเภทนี้จะให้ความสำคัญกับการเรียงลำดับข้อมูลก่อน-หลัง และความถี่ในการนำเสนอข้อมูลนั้น การค้นหาข้อมูล โดยวิธีการเช่นนี้จะมีความรวดเร็วมาก แต่มีความละเอียดในการจัดแยกหมวดหมู่ของข้อมูลค่อนข้างน้อย เนื่องจากไม่ได้คำนึงถึงรายละเอียดของเนื้อหาเท่าที่ควร แต่หากว่าคุณต้องการแนวทางด้านกว้างของข้อมูล และความรวดเร็วในการค้นหา วิธีการนี้ก็ใช้ได้ผลดี

                 Subject Directories การจำแนกหมวดหมู่ข้อมูล Search Engine ประเภทนี้ จะจัดแบ่งโดยการวิเคราะห์เนื้อหา รายละเอียด ของแต่ละเว็บเพจ ว่ามีเนื้อหาเกี่ยวกับอะไร โดยการจัดแบ่งแบบนี้จะใช้แรงงานคนในการพิจารณาเว็บเพจ ซึ่งทำให้การจัดหมวดหมู่ขึ้นอยู่กับวิจารณญาณของคนจัดหมวดหมู่แต่ละคนว่าจะจัดเก็บข้อมูลนั้นๆ อยู่ในเครือข่ายข้อมูลอะไร ดังนั้นฐานข้อมูลของ Search Engine ประเภทนี้จะถูกจัดแบ่งตามเนื้อหาก่อน แล้วจึงนำมาเป็นฐานข้อมูลในการค้นหาต่อไป การค้นหาค่อนข้างจะตรงกับความต้องการของผู้ใช้ และมีความถูกต้องในการค้นหาสูง เป็นต้นว่า หากเราต้องการหาข้อมูลเกี่ยวกับเว็บไซต์ หรือเว็บเพจที่นำเสนอข้อมูลเกี่ยวกับคอมพิวเตอร์ Search Engine ก็จะประมวลผลรายชื่อเว็บไซต์ หรือเว็บเพจที่เกี่ยวกับคอมพิวเตอร์ล้วนๆ มาให้คุณ

                 Metasearch Engines จุดเด่นของการค้นหาด้วยวิธีการนี้คือสามารถเชื่อมโยงไปยัง Search Engineประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล แต่การค้นหาด้วยวิธีนี้มีจุดด้อย คือ วิธีการนี้จะไม่ให้ความสำคัญกับขนาดเล็กใหญ่ของตัวอักษรและมักจะผ่านเลยคำประเภท Natural Language (ภาษาพูด) ดังนั้นหากคุณจะใช้ Search Engine แบบนี้ละก็ ขอให้ตระหนักถึงข้อบกพร่องเหล่านี้ด้วย 

การทำงานของ Search Engine 
การทำงานของ Search Engine จะประกอบไปด้วย ส่วนหลักๆ คือ
            1. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือน
            2. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์ ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด
            3. โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้ การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว การกลั่นกรองผลที่ได้ เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล
ดังนั้น การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการของเรา 

ไม่มีความคิดเห็น:

แสดงความคิดเห็น