Ontology structure
เครื่องมือสำคัญที่ใช้เชื่อมต่อข้อมูลที่เป็นเอกลักษณ์ของ Ontology เข้าไว้ด้วยกัน แบ่งออกได้เป็นสองความสัมพันธ์ คือ
1. is_a เป็นเครื่องมือที่แสดงถึงความเป็นส่วนย่อยของข้อมูล บอกถึงความสัมพันธ์ในเชิงของ class-subclass กล่าวคือ ถ้าพบข้อมูลที่แสดงให้เห็นว่า ก is_a ข แสดงว่า ก เป็นสมาชิกที่มีอยู่ในกลุ่ม ข เช่น nuclear chromosome is_a chromosome เป็นต้น
2. part_of เป็นเครื่องมือที่แสดงถึงความเป็นส่วนหนึ่งของข้อมูลย่อยที่มีต่อข้อมูลใหญ่ โดยความสัมพันธ์จะเป็นในรูปขององค์ประกอบ กล่าวคือถ้าพบข้อมูลที่แสดงให้เห็นว่า ค part_of ง นั้นแสดงว่า ค จัดเป็นองค์ประกอบหนึ่งของ ง เมื่อใดก็ตามที่มีการปรากฎขึ้นของข้อมูล ค จะเป็นที่แน่นอนว่า ค ที่ปรากฎนั้นจะเป็นส่วนประกอบหนึ่งของ ง ทันที แต่ว่าไม่จำเป็นเสมอไปที่จะมีการปรากฎขึ้นของ ค ทุกครั้งไป ตัวอย่างเช่น nucleus part_of cell ความหมายก็คือ นิวเคลียสเป็นส่วนประกอบหนึ่งของเซลล์ แต่ก็ไม่ใช่เซลล์ทุกเซลล์ที่มีนิวเคลียส
ภาพที่ 5 ความสัมพันธ์ของการใช้ is_a และ part_of ร่วมกับเอกลักษณ์ทางชีววิทยาต่างๆ ผ่านการจัดระบบข้อมูลของ Ontology
ที่มา: Poula et al,2007. Phenotype ontologies: the bridge between genomics and evolution.
จากองค์ประกอบต่างๆที่กล่าวถึงข้างต้นทำให้สามารถจำแนกชุดข้อมูลที่มีขนาดใหญ่ได้โดยง่าย การจัดระบบโครงสร้างของ ontology นั้นทำให้สร้างความสัมพันธ์ของหน้าที่การทำงาน และโครงสร้างต่างๆได้ เห็นภาพอย่างชัดเจน แม้แต่คำจำกัดความของขอบเขตข้อมูลที่ใช้แบ่งประเภทของสสารทางชีวเคมี ที่กล่าวถึงข้างต้น ก็สามารถนำมาจัดเข้าโครงสร้างของ ontology ได้ดังภาพที่ 6 ซึ่งทำให้การทำความเข้าใจกับข้อมูลพื้นฐานของ Gene Ontology สามารถทำได้ง่ายขึ้น
Species-specific terms
ปัญหาหนึ่งที่พบได้ผ่านการใช้คำจำกัดความของเครื่องมือทาง Ontology คือ ความไม่ชัดเจนของชุดข้อมูล กล่าวคือไม่สามารถชี้เฉพาะลงไปได้ว่าข้อมูลที่กำลังสนใจอยู่นั้น อ้างอิงอยู่กับฐานข้อมูลใด ยกตัวอย่างเช่นเมื่อมีการกล่าวถึงการแตกหน่อ โดยไม่กำหนดฐานข้อมูลที่ชัดเจน การที่ความที่เกิดขึ้นจะจำแนกออกไปได้เป็นหลายกรณี เช่น การแตกหน่อของยีสต์ การแตกหน่อของต้นไม้ หรือแม้กระทั่งการแตกหน่อ (เกิดขึ้น) ของฟัน สิ่งเหล่านี้สามารถแก้ไขได้ผ่านทางคำศัพท์ควบคุมที่เรียกว่า sensu
Sensu ให้คำจำกัดความได้ว่า ‘In the sense of’ นั่นคือเมื่อใช้ sensu จะทำให้ผู้ศึกษาข้อมูลเข้าใจได้ว่า กำลังอ้างอิงอยู่กับฐานข้อมูลใด เช่นจากตัวอย่างที่ยกไว้ข้างต้น ถ้าเพิ่มข้อมูลในส่วนของ sensu เข้าไปด้วยจะทำให้ทราบได้ทันทีว่ากำลังกล่าวถึงสิ่งใด เช่น เมื่อกล่าวถึงการแตกหน่อ โดยกำหนดข้อมูลควบคู่ไปด้วยว่า sensu Saccharomyces ก็จะทำให้ทราบได้ทันทีว่าอ้างถึงฐานข้อมูลที่เป็นยีสต์ หรือถ้ากำหนด sensu Metazoa ก็จะทำให้ทราบได้ว่ากำลังกล่าวถึงฟันของสัตว์เลี้ยงลูกด้วยนม เป็นต้น
ฐานข้อมูลของ Gene Ontology
การจัดชุดข้อมูลของ Gene Ontology นั้น มีความหลากหลายมาก ถึงแม้ว่าจะใช้ข้อมูลพื้นฐานบางส่วนร่วมกันแต่ก็ยังไม่สามารถจำกัดข้อมูลให้อยู่ในรูปที่เล็กที่สุดได้ เนื่องจากจะทำให้เกิดความเข้าใจ หรือได้ผลลัพธ์ของข้อมูลที่คลาดเคลื่อนไปจากความเป็นจริง จึงทำให้การพัฒนาความรู้ด้านการจัดระเบียบข้อมูลของยีนผ่านทาง Ontology มีความก้าวหน้าอย่างต่อเนื่องตลอดมา ภายใต้ความร่วมมือของนักวิจัยในสังกัด GO consortium
GO สร้างขึ้นเป็นครั้งแรกในปีคริสต์ศักราช 2000 โดยแรกเริ่มนั้นมีการจัดรวบรวมฐานข้อมูลเพียงสามชุดคือ FlyBase (Drosophila), MGI (Mouse) และ SGD (Saccharomyces. cerevisae) โดยฐานข้อมูลทั้งสามนี่ยังคงมีการใช้งานอยู่จนถึงปัจจุบัน หลังจากนั้นก็มีการพัฒนาการจัดระเบียบฐานข้อมูลเพิ่มขึ้นมากมาย จนถึงปัจจุบันมีฐานข้อมูลของ GO เป็นจำนวนมาก นอกจากนี้ยังมีชุดของฐานข้อมูลที่อยู่ระหว่างการพัฒนาอีกจำนวนหนึ่ง ตัวอย่างของชนิดสิ่งมีชีวิตที่ได้รับการจัดระเบียบฐานข้อมูลแล้ว และได้รับการยอมรับ และใช้งานจริงในหมู่นักวิทยาศาสตร์นั้นมีอยู่เป็นจำนวนมาก ยกตัวอย่างประเภทของสิ่งมีชีวิตที่รู้จักกันดี เช่น
1. Arabidopsis thaliana
2. Caenorhabditis elegans
3. Danio rerio (zebrafish)
4. Dictyostelium discoideum
5. Drosophila melanogaster
6. Escherichia coli
7. Homo sapiens
8. Saccharomyces cerevisiae
9. Mus musculus
10. Schizosaccharomyces pombe
11. Gallus gallus
12. Rattus norvegicus
สมัครสมาชิก:
ส่งความคิดเห็น (Atom)
ไม่มีความคิดเห็น:
แสดงความคิดเห็น