معلومة

الأمراض البشرية وقاعدة بيانات النمط الظاهري المرتبطة بها؟

الأمراض البشرية وقاعدة بيانات النمط الظاهري المرتبطة بها؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هل يعرف أحد أي قواعد بيانات جيدة تحتوي على أعراض لأمراض وأمراض أخرى لدى البشر؟ لقد حاولت العمل مع UMLS ، لكن كان من المستحيل العمل معه. لقد حاولت أيضًا العمل مع موقع الويب الخاص بعلم الوجود (http://www.disease-ontology.org/) ، ولكن لا يبدو أن ذلك ... شامل ... من حيث أعراض الأمراض التي يعانون منها.

لقد حاولت الاطلاع على قاعدة بيانات الأمراض (http://www.diseasesdatabase.com/) ، لكنهم يترددون في تسليم البيانات الأولية ، إذا فهمت بشكل صحيح.

أي شخص لديه أفكار أفضل؟


يبدو لي أنك تريد فعليًا اتخاذ مصفوفة قرار.

لذلك ... كما ذكرنا أعلاه ، سيكون لدى التصنيف الدولي للأمراض و SNOMED CT رموز لأمراضك وأعراضك. كنت أميل نحو SNOMED CT بسبب الطريقة التي تنظم بها المفاهيم. بشكل أساسي من واسع إلى محدد. بهذه الطريقة يمكن للمستخدمين إدخال أعراض محددة للغاية ، وتحتاج المصفوفة الخاصة بك فقط إلى أعراض محددة كما هو مطلوب. على سبيل المثال ، يمكنك أن تقول "القيء" هو أحد أعراض "التسمم الكحولي" في ديسيبل. وإذا دخل المستخدم في عملية "القيء المقذوف" ، فإن هيكل SNOMED يتعرف على هذا كنوع من التقيؤ.

لكن - الأعراض لا تسبب المرض ، ومعظم الأمراض لديها مجموعة كبيرة من "الأعراض المحتملة" (وهذا هو السبب في أن SNOMED CT ليس لديها مثل هذه العلاقات). لذا فهي ليست مهمة سهلة. ولهذا السبب يتردد أولئك الذين قاموا بعمل مثل هذه الديسيبلات (كما قمت بالارتباط) في مشاركة عنوان IP الخاص بهم ، على الأقل بدون $$$.

إذا كنت ستصنع بنفسك ، فإليك بعض النصائح. انصح:

  • فقط الأمراض ذات الصلة بحالة الاستخدام الخاصة بك - على سبيل المثال. لا تتطلب رعاية المسنين اضطرابات لدى الأطفال ؛
  • استبعاد الأعراض غير المحددة ؛
  • رتب الأعراض حسب التكرار - على سبيل المثال. 60٪ من النساء الحوامل يعانين من غثيان الصباح ، حيث أن 100٪ لديهن هرمون موجهة الغدد التناسلية المشيمائية البشرية (HCG)> 10 *

أتمنى أن يساعدك هذا. وحظا سعيدا.

تحرير- هناك موضوع مماثل على LinkedIn

*إحصائية ملفقة :).


قاعدة بيانات الأمراض الجينية

في المعلوماتية الحيوية ، أ قاعدة بيانات الأمراض الجينية عبارة عن مجموعة منهجية من البيانات ، يتم تنظيمها عادةً لنمذجة جوانب الواقع ، بطريقة لفهم الآليات الكامنة وراء الأمراض المعقدة ، من خلال فهم التفاعلات المركبة المتعددة بين علاقات النمط الظاهري والنمط الجيني وآليات الأمراض الجينية. [1] تدمج قواعد بيانات الأمراض الجينية جمعيات أمراض الجينات البشرية من عدة قواعد بيانات منسقة من قبل خبراء وجمعيات مشتقة من استخراج النصوص بما في ذلك الأمراض المندلية والمعقدة والبيئية. [2] [3]

قاعدة بيانات الأمراض الجينية
تصنيفالمعلوماتية الحيوية
التصنيف الفرعيقواعد بيانات
نوع قواعد البياناتبيولوجي
نوع فرعي من قواعد البياناتمرض الجينات


الملخص

توفر قواعد بيانات النمط الوراثي والنمط الظاهري معلومات حول التباين الجيني وعواقبه وآليات عمله لأغراض البحث والرعاية الصحية. تختلف قواعد البيانات الموجودة اختلافًا كبيرًا في النوع ومجالات التركيز وأنماط التشغيل. على الرغم من مجموعات البيانات الأكبر والأكثر تعقيدًا - التي أصبحت ممكنة من خلال التقدم في تسلسل الحمض النووي وطرق omics وتقنيات النمط الظاهري - يتم إحراز تقدم مطرد نحو دمج قواعد البيانات هذه بدلاً من استخدامها ككيانات منفصلة. إن التحول المترتب على التركيز من المتغيرات أحادية الجين نحو الألواح الجينية الكبيرة ، والإكسومات ، والجينوم الكامل ، والخصائص التي يمكن ملاحظتها لا تعد ولا تحصى ، يخلق تحديات وفرصًا جديدة في تصميم قاعدة البيانات ، وتفسير الإمراضية المتغيرة وأنماط تمثيل البيانات واستخدامها.


مقدمة

غالبًا ما يتم إعلام فهمنا لوظيفة الجينات بمقارنة النتائج المظهرية للطفرة مع "النوع البري" الكنسي في كائن حي واحد ، وكذلك بين طفرات الجينات المتعامدة في الكائنات الحية المختلفة. على وجه الخصوص ، قدمت الكائنات النموذجية نظرة ثاقبة للوظيفة الجينية في البشر. أصبحت أهمية والحاجة إلى أتمتة هذه المقارنات بين الأنواع أمرًا ضروريًا حيث يتم إجراء شاشات الطفرات واسعة النطاق في الكائنات الحية النموذجية. ومع ذلك ، فإن العائق الأساسي للتحليل هو عدم وجود طريقة حسابية يمكن تتبعها لوصف الأنماط الظاهرية التي يمكن تطبيقها عبر مجالات متعددة من المعرفة البيولوجية والأنواع (على سبيل المثال ، انظر [1]). لا يقتصر الأمر على أن كل كائن حي له مفرداته الخاصة لوصف عواقب النمط الظاهري للطفرة ، ولكن هذه المفردات عادةً ما ترتبط بالتشريح أو الفسيولوجيا الخاصة بالكائن الحي. غالبًا ما يتم تسجيل هذه الأوصاف كنص حر ، وعلى الرغم من أنها معبرة بشكل رائع ، يظل النص الحر صعبًا للمقارنة بشكل موثوق مع الأساليب الحسابية. على سبيل المثال ، لن يتمكن برنامج الكمبيوتر من التعرف على حقيقة وجود تشابه كبير بين PAX6 الطفرات التي تؤدي إلى فئران "صغيرة العينين" ، و "القرنية المعتمة" في البشر ، و "شبكية العين المشوهة" في أسماك الزرد ، و "بلا عيون" ذبابة الفاكهة (شكل 1).

الأنماط الظاهرية من النوع البري (أعلى) و PAX6 يمكن وصف الطفرات التقويمية (أسفل) في الإنسان والماوس وسمك الزرد والذباب بطريقة EQ. يتم سرد شروح EQ للأنماط الظاهرية غير الطبيعية أسفل كل مجموعة من الصور لكل كائن حي. لاحظ أن الكيانات التشريحية هي من ssAOs والصفات هي من علم الوجود PATO. هؤلاء PAX6 تم وصف الأنماط الظاهرية نصيًا على النحو التالي. قد تؤدي الطفرات البشرية إلى أنيريديا (غياب القزحية) ، وعتامة القرنية (اعتلال القرنية المرتبط بأنيريديا) ، وإعتام عدسة العين (غشاوة العدسة) ، والزرق ، وتنكس الشبكية على المدى الطويل. بالنسبة للفأر ، تظهر الطفرات صغر العين الشديد مع عتامة العدسة / القرنية وشذوذ في قزحية العين ، وهناك سدادة كبيرة من الخلايا الظهارية المستمرة التي تظل متصلة بين القرنية والعدسة. بالنسبة لأسماك الزرد ، فإن الطفرات تعبر عن نمط ظاهري متغير وقابل للتعديل يتكون من انخفاض حجم العين وتقليل حجم العدسة وتشوه شبكية العين. ذبابة الفاكهة eyPAX6 ortholog) الطفرات تسبب فقدان نمو العين. الأنماط الجينية المعروضة هي الماوس E15 باكس 6 14 نيو / 14 نيو [68] ، 5 أيام الزرد pax6b tq253a / tq253a [69] ، الإنسان PAX6 + / - [70] و ذبابة الفاكهة ey - / - [71].

تحدد المنهجيات الحالية تقليديًا النماذج الحيوانية على أساس التقويم المتسلسل بين نموذج الحيوان الطافرة والجين البشري. على سبيل المثال ، Schuhmacher et al. طور مؤخرًا نموذجًا فأرًا لمتلازمة كوستيلو البشرية (OMIM: # 218040) ، وهي متلازمة تنموية عصبية - قلب - جلدية - جلدية ناتجة عن طفرات في H-RAS الجين [2]. الفأر H- راس تم تحور الجين في وضع تقويم العظام كما هو الحال في مرضى Costello ، والنمط الظاهري الناتج يلخص المرض. من حين لآخر ، يمكن التعرف على النماذج التلقائية من خلال ملاحظة الأعراض التي تذكرنا بأمراض الإنسان ، على سبيل المثال الاسترالي الدهون يصاب الفأر بالسمنة ومرض السكري من النوع 2 والعقم عند الذكور. يشبه هذا النمط الظاهري متلازمة ألستروم البشرية ، والتي تسببها طفرة في صدقات 1 الجين [3]. التسلسل والتوصيف الإضافي لـ الاسترالي الدهون كشف عن طفرة في الصدقة 1، و الاسترالي الدهون يظهر كنموذج حيواني جيد لفهم متلازمة ألستروم ووظيفة الأهداب المترجمة الصدقة 1 [4]. اعتمدت هذه الأمثلة لتحديد النماذج الحيوانية للأمراض على معرفة الأساس الجيني للمرض الذي يصيب الإنسان ، ولكن هناك العديد من الأمراض البشرية التي لم يتم التعرف عليها بعد. إذا تمكن الباحث من مقارنة نموذج الكائن البشري ، وحتى الأنماط الظاهرية للأسلاف بشكل مباشر ، فسيكون لديه آلية لتحديد الجينات والنماذج المرشحة للمرض بشكل أسرع.

تستفيد مجتمعات الكائنات الحية النموذجية من المجموعات المركزية للبحوث المنسقة ، حيث يمكن للعالم البحث عن بيانات جينية متقاطعة على نطاق واسع ، ونمط ظاهري ، وبيانات جينومية ، يشار إليها باسم "قواعد بيانات الكائن النموذجي" (MODs). يعاني البحث في مجال البيولوجيا البشرية بسبب عدم وجود مورد مكافئ لمجتمع البحث البشري ، وربط مجموعات البيانات المتنوعة هذه يتطلب البحث في العديد من الموارد المنفصلة. ومع ذلك ، هناك العديد من موارد البيانات القيمة لبيانات النمط الظاهري للإنسان ، بما في ذلك الوراثة المندلية على الإنترنت في الإنسان (OMIM) [5] الذي نشره المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI). يحتوي OMIM على أكثر من 19000 سجل ، مقسمة بين الجينات والأنماط الظاهرية / الأمراض. يحتوي ما يقرب من 53٪ من سجلات الجينات على أوصاف متغيرة أليلية مفصلة و / أو ملخصات سريرية عامة ، في حين أن 43٪ من سجلات النمط الظاهري / المرض لها أساس جزيئي معروف. OMIM هو مورد قائم على النص ، واسترجاع المعلومات يعاني من هذه الحقيقة ، كما تظهر عمليات بحث Entrez في الجدول 1. بالنسبة للباحث الفردي الذي يرغب في معرفة الطفرات البشرية التي قد تؤدي إلى زيادة حجم العظام ، أو قيام برنامج نصي بالكمبيوتر بتعدين بيانات OMIM ، فإن التعليقات التوضيحية النصية المجانية لا توفر الدقة اللازمة للاستعلام. في حين تم إثبات التنقيب الناجح عن الأدبيات لربط الجينات بالأنماط الظاهرية [6] ، فإنه لا يوفر آلية لمقارنة الأنماط الظاهرية بشكل مباشر.

واحدة من أكثر الأدوات ثورية بالنسبة لعلماء الأحياء هي القدرة على مقارنة التسلسلات باستخدام خوارزميات مثل BLAST [7] ، والتي تتيح للشخص تقييم التشابه كميًا بين واحد أو أكثر من التسلسلات. ومع ذلك ، فإن الأساس الجيني للمرض غالبًا ما يكون غير معروف ، وفي هذه الحالة لا تكون أداة مقارنة التسلسل مفيدة لتحديد الطفرات التسلسلية. إذا كانت توصيفات الأنماط الظاهرية تستند إلى مفردات شائعة يتم التحكم فيها - أ الأنطولوجيا- سيتم تنظيمها بحيث يمكن كتابة الخوارزميات لمقارنة الأنماط الظاهرية حسابيًا. تتمثل إحدى فوائد استخدام علم الوجود في القدرة على استخدام أدوات الاستدلال المنطقي للأغراض العامة التي تسمى المنطقين (على سبيل المثال ، انظر [8]). يمكن للمفكرين المساعدة في الإجابة على الاستفسارات والتحليل. على سبيل المثال ، ضع في اعتبارك استعلامين مختلفين ، أحدهما للعثور على الجينات المعبر عنها في ZFA: الأمعاء ، والآخر للعثور على الجينات المعبر عنها في ZFA: الظهارة (نكتب مصطلحات علم الوجود مسبوقة باسم الأنطولوجيا انظر المواد والطرق لمزيد من المعلومات. تفسير). نتوقع أن تؤدي عمليتا البحث هذه إلى إعادة التعليقات التوضيحية إلى ZFA: الظهارة المعوية ، لأن الأمعاء عبارة عن جزء من الأمعاء وظهارة الأمعاء هو نوع الظهارة (الشكل 2). على غرار الأبجديات النووية والأحماض الأمينية ومصفوفات المسافة المستخدمة في خوارزمية بلاست ، يمكن استخدام مصطلحات علم الوجود وعلاقاتها ببعضها البعض لتجميع ومقارنة بيانات التعبير الجيني والنمط الظاهري ويمكن استخدامها لتحليل النمط الظاهري عبر الأنواع.

يوضح هذا المثال علاقات مصطلح "ظهارة الأمعاء" بالكيانات التشريحية الأخرى ضمن علم الوجود ZFA. تشير الأسهم الرمادية التي بها حرف "i" إلى أن هو تشير الأسهم الزرقاء بحرف "p" إلى أ جزء من علاقة. تشير الأرقام إلى IC للعقدة ، وهو السجل السلبي لاحتمال استخدام هذا الوصف للتعليق على جين أو أليل أو نمط وراثي (يُطلق عليه مجتمعة ميزة). نظرًا لأن المصطلحات أصبحت أكثر عمومية ، فإن القراءة من أسفل إلى أعلى ، يكون لها درجة أقل من IC لأن المصطلحات الأكثر عمومية تستوعب التعليقات التوضيحية إلى مصطلحات أكثر تحديدًا.

يمكن تعريف النمط الظاهري على أنه نتيجة نمط وراثي معين في بيئة معينة (للمراجعة ، انظر [9]) ويمكن وصفه باستخدام علم الوجود لتسهيل المقارنات. يمكن تسجيل وصف لصفات نمطية فردية باستخدام طريقة ثنائية "EQ" (الكيان + الجودة) ، حيث يتم وصف الكيان الحامل (مثل الجزء التشريحي ، والعملية الخلوية ، وما إلى ذلك) بجودة (مثل الصغيرة ، زيادة درجة الحرارة ، دائرية ، طول مخفض ، إلخ). طريقة EQ كافية لوصف العديد من الأنماط الظاهرية ، بشرط أن تكون الأنطولوجيا المصدر غنية بما فيه الكفاية. قد تكون مصطلحات الكيان عبارة عن هياكل من أي علم تشريح أو عمليات بيولوجية أو مكونات خلوية أو وظائف جزيئية من علم الوجود الجيني (GO) [10]. تأتي مصطلحات الجودة من النمط الظاهري وأنطولوجيا السمات (PATO) ، والتي تم تصميمها لاستخدامها مع الأنطولوجيا التشريحية الخاصة بالأنواع أو الأنطولوجيا الأخرى للكيانات المشتركة بين الأنواع (انظر ، على سبيل المثال ، [11] - [13]). على سبيل المثال ، أ ذبابة الفاكهة يمكن وصف النمط الظاهري لـ "احمرار العين" باستخدام المصطلحين "أحمر" من PATO و "عين" من علم تشريح الذبابة (FBbt) في عبارة EQ EQ = FBbt: eye + PATO: أحمر. تم توسيع طريقة EQ لتشمل الصفات ذات الصلة والكيانات الإضافية ، ومع نهج ما بعد التكوين لوصف المزيد من الكيانات الدقيقة. يستخدم العديد من MODs بالفعل علم التشريح الخاص بالمجتمع ، بالإضافة إلى GO ، للتعليق التوضيحي للتعبير الجيني و / أو بيانات النمط الظاهري [14] ، [15] ، ويتم وصف هذه الطرق بالتفصيل في مكان آخر [16] ، [17]. يمكن أيضًا تطبيق الاستدلال الوجودي على أوصاف EQ ، تمامًا كما هو الحال بالنسبة لعلم الوجود الفردي ، لأنها تمثل أيضًا العقد في بنية الرسم البياني. على سبيل المثال ، استعلامات عن موقف الغضروف القحفي يجب أن تعيد الأنماط الجينية التي لها النمط الظاهري ZFA: ceratohyal + PATO: mislocalised_ventrally. وبالمثل ، فإن الاستفسارات الخاصة بالبنى الفوقية للغضروف القرني ، مثل الغضروف القحفي ، يجب أن تعيد أيضًا هذه الأنماط الجينية (الشكل 3).

يتم عرض العلاقة بين وصف EQ والأنطولوجيا المساهمة (اللوحات المرافقة). الكيانات من علم الوجود ZFA باللون الأزرق ، والصفات من PATO باللون الأخضر. التسلسل الهرمي الكامل لـ EQ (جميع مجموعات EQ الممكنة) بين ZFA: غضروف سيراتوهيال + PATO: خطأ في تحديد موقع بطني و ZFA: غضروف قحفي + PATO: يتم عرض الموضع ، مما يوضح الامتصاص عبر عقد الرسم البياني المكونة من مصطلحات وجودية متعددة. العلاقات هي كما هو موضح في الشكل 2. كما هو الحال مع الأنطولوجيا الفردية في الشكل 2 ، يمكن حساب درجات IC لعقد EQ ، حيث تحتوي عُقد EQ العامة على درجة أقل من نقاط EQ الأكثر تحديدًا.

يمكن دمج أي وصف لـ EQ مع أوصاف وبيانات EQ الأخرى ، مثل النمط الجيني ، والبيئة ، ومعرفات المرحلة من قواعد البيانات أو الأنطولوجيا الأخرى ، للتعبير بشكل كامل عن الحالة المظهرية للفرد أو المجموعة. على سبيل المثال ، يمكن للمرء أن يسجل النمط الظاهري لأسماك الزرد EQ = ZFA: طية الزعنفة المتوسطة + PATO: التوهين في المرحلة الجنينية ZFS: 26-somite مع التركيب الوراثي fbn2b gw1 / gw1 (AB) (المعرفة في شبكة معلومات الزرد ، ZFIN). باستخدام هذه الطريقة ، يمكن تسجيل الأنماط الظاهرية باستخدام العديد من الأنطولوجيا بطريقة معبرة للغاية ومفصلة بدقة مع الحفاظ على المنطق الصحيح وإمكانية الحساب.

الأدوات الحسابية الحالية غير كافية لتخزين وتحليل بيانات شرح النمط الظاهري المستندة إلى علم الوجود بطريقة عامة ومحايدة للأنواع. على وجه الخصوص ، هناك نقص في الأدوات اللازمة للمقارنات بين الأنواع اللازمة لتحديد الجينات المرشحة والنماذج الحيوانية للأمراض. تم تطوير واختبار العديد من الخوارزميات الحالية باستخدام GO لقياس التشابه الدلالي للتعليقات التوضيحية وتوفير نقطة انطلاق جيدة للتحليل (على سبيل المثال ، انظر [18] - [21]). لم يكن من الواضح مدى نجاح هذه الخوارزميات في تحليل مجموعات البيانات باستخدام مجموعة من علم الوجود. بالإضافة إلى ذلك ، المقارنات بين الأنواع لن تكون ممكنة لأنه لم تكن هناك روابط بين الأنطولوجيا التشريحية المختلفة. يقترح Schlicker و Albrecht [22] نهجًا قائمًا على محتوى المعلومات (IC) لتحليل ملامح النمط الظاهري المصنوع من عدة علميات ، على الرغم من أنهم اختبروا نتائجهم فقط مع التعليقات التوضيحية التي تم إجراؤها باستخدام GO المحايد للأنواع. تتطلب أداة FunSimMat الخاصة بهم قائمة محددة من البروتينات للمقارنة ، وبالتالي فهي لا توفر وسيلة للبحث الشامل عن الجينات المماثلة ظاهريًا. PhenomicDB [23] هو مورد متعدد الأنواع قام بتجميع التعليقات التوضيحية من موارد متنوعة وأنماط ظاهرية للنص الحر من أجل توفير "مجموعات ظاهرية" من الجينات المرتبطة بالنمط الظاهري. ومع ذلك ، فإن تحليلهم لم يستفد من العلاقات الموجودة في علم الوجود المصدر. على الرغم من أن البروتينات المتفاعلة المعروفة تم تجميعها معًا ، إلا أنهم لاحظوا أن "العناقيد الظاهرية" الناتجة عنها تميل إلى أن تكون خاصة بالأنواع بسبب المصطلحات الخاصة بالمجتمع التي تم استخدامها في التعليقات التوضيحية ، وليس بالضرورة بسبب البيولوجيا الأساسية. كانت هذه الأساليب الحالية غير كافية لاحتياجاتنا لأنها إما تستند إلى النص الحر أو تستخدم مجموعة محدودة من الأنطولوجيات للتعليق التوضيحي ، ولأنها تفتقر إلى إطار عمل لدمج ومقارنة الكيانات التشريحية بين الكائنات الحية. كما أنهم يفتقرون إلى مقاييس لتحديد الأهمية في حسابات التشابه. أخيرًا ، بصرف النظر عن جانب الاستعلام ، لم يتضمن أي منها طريقة محايدة للأنواع لتسجيل الأنماط الظاهرية de novo.

من خلال شرح الأنماط الظاهرية باستخدام طريقة EQ هذه ، جنبًا إلى جنب مع أدوات التحليل الحسابي المناسبة ، لدينا فرصة فريدة لتوحيد البيانات المظهرية والاستعلام عنها بطريقة صارمة ومضيئة. في هذه الدراسة ، اختبرنا الفرضية القائلة بأن شرح EQ للأنماط الظاهرية للمرض سيسهل اكتشاف علاقات النمط الجيني والنمط الظاهري الجديدة داخل الأنواع وعبرها. قمنا بتوضيح 11 جينة مرضية بشرية من EQ من أوصاف OMIM للنص الحر باستخدام برنامج Phenote [24] لتوفير مجموعة بيانات للمقارنة بين الأنواع. قارنا هذه التعليقات التوضيحية بالتعليقات التوضيحية الخاصة بأخصائيي تقويم الفأر وأسماك الزرد ، الأمر الذي تطلب تطوير علم الوجود الموحد عبر الأنواع (UBERON) لتوفير جسر بين مختلف علم التشريح. لقد طورنا أيضًا مقاييس جديدة ووسعة موجودة لقياس التشابه الظاهري بين الجينات. قمنا بتقييم أدائها النسبي من خلال تحليل مسارات الإشارات المعروفة والتفاعلات الجينية وأظهرنا أنه يمكن الاستعلام عن هذه البيانات ومقارنتها بالنمط الظاهري وحده لتحديد أوجه التشابه ذات المعنى البيولوجي. علاوة على ذلك ، توفر هذه التعليقات التوضيحية موردًا لفهم أفضل للأنماط الظاهرية للأمراض الموجودة. نستنتج أن هذه الطريقة يمكن أن تسهل اكتشاف ارتباطات النمط الجيني الجديد داخل الأنواع وفيما بينها.


مناقشة

الأعمال ذات الصلة

تم استخدام الارتباطات بين الأنماط الظاهرية والعلامات والأعراض من جانب والأمراض من ناحية أخرى لاكتساب نظرة ثاقبة على الطبيعة المعيارية وهيكل الشبكة للأمراض البشرية ومؤشرات الأدوية. في العمل السابق ، تم استخدام التنقيب عن النص استنادًا إلى تسميات الأمراض وعلامات الأنماط الظاهرية (العلامات والأعراض) 27 ، أو معرفات المكنز 28 لعناوين الموضوعات الطبية (MeSH) المرتبطة باقتباسات المقالات في Pubmed ، لتحديد الارتباط بين المرض والنمط الظاهري. بشكل عام ، تم تقييم ارتباطات النمط الظاهري الناتجة عن المرض بناءً على قدرتها على الكشف عن مجموعات الأمراض المتصورة أو شرحها 12 ، أو مجموعة الأمراض ذات المسببات المشتركة المعروفة معًا 26،27 ، بناءً على المقارنة المعيارية الذهبية وتجميع الأهداف الدوائية الشائعة 27 .

كان أحد الأسئلة الأساسية التي لم تتم الإجابة عليها من قبل أي من الأساليب السابقة هو نوع الدليل أو الدعم المطلوب لاعتبار ارتباط المرض بالنمط الظاهري "صحيحًا". هذا هو التحدي الأساسي في أي نوع من خصائص النمط الظاهري أو أعراض المرض. معظم الأمراض لها علامات وأعراض أساسية ترتبط دائمًا بالمرض. ومع ذلك ، فإن عددًا كبيرًا من العلامات والأعراض الخاصة بمرض ما لا توجد دائمًا ولكنها تحدث بتواتر متفاوت وحتى المظاهر النادرة جدًا قد تكون مفيدة للغاية في سياق التشخيص التفريقي. في تقييمنا ، نقدم مقياسًا قابلاً للقياس الكمي من خلال المقارنة مع البيانات التجريبية التي يمكن استخدامها لتحديد - وتعظيم - أداء جمعيات النمط الظاهري للأمراض الملغومة بالنص في التنبؤ بالجينات المرشحة للأمراض البشرية. لذلك نقدم مقياسًا موضوعيًا يمكن استخدامه لتحديد مدى قابلية مجموعة من ارتباطات النمط الظاهري للمرض لمسألة علمية معينة - في حالتنا ، تحديد الجينات المرشحة للأمراض ذات الأصل الجيني. في حين أن التطبيقات المختلفة قد تتطلب مجموعات مختلفة من الأنماط الظاهرية المرتبطة بمرض ما ، فإننا نعتقد أن استراتيجية التقييم هذه توفر أيضًا مؤشرًا على الفائدة المحتملة لهذه الأنماط الظاهرية الملغومة بالنص لإجراء مزيد من التحقيقات العلمية ، أي كيف يمكن استخدام ارتباطات الأنماط المرضية هذه لدعم دراسات إضافية حول الآليات الكامنة وراء الأمراض.

يتمثل أحد القيود الرئيسية في تقييمنا في أنه يقتصر على الأمراض الوراثية في OMIM ، في حين أن غالبية الأمراض في DO هي معقدة أو شائعة أو مكتسبة من خلال تأثيرات البيئة أو العوامل المعدية. يمكن للمقاربات الأخرى ، مثل تجميع الأمراض بناءً على التشابه وتحديد المجموعات ذات المغزى والمعروفة جيدًا 12،26 ، أو المقارنة مع مؤشرات الأدوية المعروفة 27 ، تقييم الصلاحية البيولوجية للارتباطات المتولدة ، ولكن غالبًا لا يمكنها تحديد النتائج.

جينات مرشحة جديدة تعتمد على الأنماط الظاهرية الملغومة بالنص

من خلال نهجنا ، لا نحصل فقط على توصيف النمط الظاهري للأمراض الشائعة والمعدية ، ولكننا حصلنا أيضًا على ارتباطات جديدة للنمط الظاهري للأمراض القائمة على وراثي في ​​OMIM والتي لا يوجد لها حاليًا أي توصيف ظاهري سواء في تعليقات HPO التوضيحية أو كموجز سريري في OMIM .

تحتوي قاعدة بيانات HPO على شروح النمط الظاهري لـ 9286 مدخلات OMIM (الجينات والأمراض). من خلال تعيينات DO – OMIM وطريقتنا ، نحصل على أنماط ظاهرية لـ 1،683 مدخلات OMIM ، 115 منها لا تحتوي على تعليقات على النمط الظاهري في HPO أو ملخص سريري مرتبط في OMIM. على سبيل المثال، هالو نيفي (Leukoderma مكتسبات الطرد المركزي من Sutton، OMIM: 234300) ، وهي حالة جلدية يتم فيها تدمير الخلايا الصباغية بواسطة الخلايا الليمفاوية التائية CD8 + السامة للخلايا 29 ، ولا يوجد حاليًا أي تخليق سريري في OMIM وبالتالي لا توجد أنماط ظاهرية مرتبطة في قاعدة بيانات HPO ، بينما نحدد العديد من الأنماط الظاهرية ، بما في ذلك تصبغ متغير (MP: 0010016) ، مورفولوجيا الخلايا الصباغية غير الطبيعية (MP: 0002877) و - البهاق (HP: 0001045) كأنماط ظاهرية ، وكلها معروفة بأنها مرتبطة بـ halo nevi 30.

بالنسبة لهذه الأمراض الـ 115 ، عُرف 167 نموذجًا للأمراض لدى الفئران. يمكننا إعطاء الأولوية للنموذج الصحيح باستخدام ROCAUC البالغ 0.926 ± 0.049 لهذه المجموعة المكونة من 115 مرضًا (الشكل 7).

منحنى ROC للاسترجاع المرتبة لنماذج مرض MGI عن طريق التشابه الدلالي مع الأنماط الظاهرية الملغومة بالنص للأمراض بدون ملخص سريري في OMIM (ROCAUC: 0.926 ± 0.049).

استكشاف أوجه التشابه بين المرض والمرض

تظهر شبكة التشابه بين المرض والمرض (الشكل 6) علاقات تشابه ظاهرية بين الأمراض الشائعة والوراثية والمعدية والبيئية. تمثل كل عقدة في الشبكة مرضًا ويتم تلوينها وفقًا لفئة المرض ذات المستوى الأعلى المقابلة لها في DO. بناءً على شبكة التشابه هذه ، نلاحظ أنه يمكن فصل أمراض الأنظمة والعمليات المرضية المختلفة على أساس ارتباط النمط الظاهري. يصنف DO حسب كل من الموقع التشريحي أو النظام وعلم الأمراض العام ولكل من التصنيفات ، على الرغم من هذه المعايير المختلفة ، نجد أن الأمراض ضمن فئة واحدة عادة ما تكون قريبة من بعضها البعض على أساس الارتباط المظهري وحده. ويدعم ذلك تحليلنا العنقودي ، حيث نجد تشابهًا قويًا بين المجموعات المنتجة بناءً على التشابه الظاهري والتمييزات عالية المستوى التي أجراها DO (مؤشر Rand 0.828).

يمكننا أيضًا تحديد التشابه بين مجموعات الأمراض ذات الصلة بالمسببات والتي تُظهر أنماطًا متداخلة. أحد الأمثلة على هذه المجموعات هي أمراض التخزين الليزوزومية. تحتوي جميع الخلايا على الليزوزومات التي تحتوي على هيدرولازات حمضية قابلة للذوبان يتمثل دورها في معالجة مجموعة واسعة من الركائز. يؤدي الفشل في أداء هذه الوظيفة إلى تراكم الليزوزومات للبروتينات غير المستقلب والكربوهيدرات ، والتي تعد السبب الرئيسي للمرض من خلال تأثيرها على التمثيل الغذائي الخلوي. أصبحت المسارات التي تمارس بها هذه التراكمات آثارها المرضية مفهومة للتو ، لكنها تعرض مجموعة واسعة من أعراض المرض مع مشاركة عصبية مركزية ومجموعة واسعة من الأنماط الظاهرية المحيطية مع مظاهر فردية متغيرة للغاية 31. يوضح الشكل 8 العلاقات المظهرية بين جرعات سفينجوليبيدوز ، حيث تجمع بين أمراض نيمان بيك وجوشير وتاي ساكس جنبًا إلى جنب مع حثل المادة البيضاء وحثل المادة البيضاء متبدل اللون ومرض كرابي ومتلازمة البحر الأزرق للنسيج ومرض فاربر. ومن المثير للاهتمام أننا نجد شكلين من أشكال الضمور العضلي النخاعي في المنطقة الظاهرية من هذه الأمراض والتي لا تعتبر بشكل عام ناجمة عن اضطراب التخزين الليزوزومي. ومع ذلك ، فقد تم الإبلاغ مؤخرًا عن أنه في الشكل 4- الأفراد الذين يعانون من نقص (مرض شاركو ماري توث من النوع 4J) ، الذين يظهرون تنكس العصبونات الحركية في العمود الفقري ، وضعف عضلي وضمور ، الخلايا العصبية والخلايا الدبقية تتراكم الدهون والبروتين ، تذكرنا بنيمان-بيك ، تاي ساكس والنوع الرابع داء الكوليبيدات. يرتبط هذا النمط من التراكم بتنكس الخلايا العصبية وإزالة الميالين من الأعصاب الطرفية في جرعات GM2 العقدية 32،33 ومن المحتمل أن تكون حالة الاعتلال العصبي في مرض شاركو ماري توث من النوع 4J. من المحتمل أن يكون تضمين الضمور العضلي النخاعي في الحي المظهرى لداء السفينجوليبيد بسبب تأثير اضطرابات التخزين الليزوزومية للجهاز الحركي والتي تتجلى على أنها ضمور عضلي عصبي المنشأ. يتشابه هذا التشابه الظاهري المذهل في النوع مع ذلك الذي شوهد في اعتلال الهدبيات 34 حيث تعكس مجموعة من الأنماط الظاهرية ذات الصلة الآفات في مجموعة من الجزيئات المشاركة في جوانب مختلفة من تجميع أو وظيفة cilium ، والتي ، إلى جانب أمثلة أخرى ، تؤدي إلى Oti و Brunner 35 لافتراض وجود وحدات وظيفية مشتركة تكمن وراء الملامح المظهرية للأمراض.

إلى اليسار: الشبكة الفرعية حول مرض تاي ساكس ، والتي تُظهر مجموعة من أمراض التخزين الليزوزومية.حق: الأمراض الجلدية وأمراض أخرى مشابهة ظاهريا ل داء الثعلبة.

تشكل الأمراض الغشائية (الشكل 8) أيضًا مجموعة من الأمراض ذات التشابه الظاهري الكبير مع التمييز الواضح بين أنواع الأمراض المختلفة. على سبيل المثال ، داء الثعلبة ، تساقط الشعر الكربي ، الثعلبة البقعية ، الثعلبة الشاملة والموسينية الجريبية ، وكلها أمراض تشمل بصيلات الشعر وتسبب تساقط الشعر ، توجد على مقربة من النمط الظاهري لكل منها. ومن المثير للاهتمام أن هذه المنطقة تحتوي على هوس نتف نتف الشعر - وسواس نتف الشعر - ومتلازمة كرونكيت - كندا ، وهي متلازمة متفرقة تم التعرف عليها مؤخرًا تشمل داء السلائل الورمي المعدي المعوي وثلاثي أمراض الجلد من تساقط الشعر ، وحثل ظهري وفرط تصبغ 36. إن تضمين التقرن الجريبي الذي يتميز بفرط التقرن الجريبي والثعلبة الندبية المترقية في هذا الحي المظهري بالمثل يُظهر ثراء البيانات المظهرية التي تم جمعها عن طريق التنقيب عن النص.

ليس من المستغرب أن نجد أيضًا (انظر الجدول 1) أن الأمراض المصنفة حسب الموقع أو النظام التشريحي (مثل أمراض الجهاز التناسلي وأمراض الجهاز التنفسي) تظهر تجانسًا ظاهريًا أعلى من الأمراض المصنفة حسب آليتها المرضية (مثل الأمراض المعدية والأمراض الوراثية). على وجه الخصوص ، نلاحظ أن فئات الأمراض المحددة بدقة مثل مرض الجهاز التناسلي, أمراض الجهاز التنفسي أو أمراض الجهاز البولي تُظهر تجانسًا ظاهريًا عاليًا فئات واسعة مثل جميع الأمراض المعدية أو أمراض الانتشار الخلوي ، من ناحية أخرى ، غير متجانسة نسبيًا. ومع ذلك ، فإن جميع فئات المستوى الأعلى في DO تتجمع بشكل كبير بناءً على تشابهها الظاهري والأمراض التي تقع في فئات DO الأكثر تحديدًا (مثل أمراض التخزين الليزوزومية) تتجمع بشكل وثيق أيضًا ، مما يدل على أن الأمراض المندلية لا تشكل وحدات المرض 12 ، 35 ، ولكن أيضا الأمراض الشائعة.


الاستنتاجات

تعكس الفينولوجيا النمطية الفطرية لأنظمة الجينات وتحدد إعادة الاستخدام التكيفية لتلك الأنظمة ، مما يخلق إطارًا ثريًا لمقارنة الأنماط الظاهرية الطفرية مع إمكانية العثور على نماذج غير واضحة للأمراض البشرية. تشير الاختبارات التي تم التحقق من صحتها إلى أن الفينولوجيات تظهر فائدة لما يقرب من ثلث إلى نصف الأمراض الوراثية البشرية المختبرة (الشكل S2). بالنظر إلى الفينولوجيا لمرض بشري ، فإن أي نهج لربط المزيد من الجينات بسمات الكائن الحي النموذجي (على سبيل المثال ، الفحص الجيني) سيقترح مرشحين جددًا لجينات المرض البشري. بالإضافة إلى ربط الجينات الفريدة بالأمراض النموذجية ، يمكن أن توفر هذه النماذج فهمًا ميكانيكيًا في الكائنات الحية النموذجية المبسطة لفهم جوانب الأمراض البشرية الأكثر تعقيدًا.

وهكذا فإن الفينولوجيين يربطون التعريفات الجزيئية للجينات المتجانسة والمتعامدة (34) بالتعاريف الكلاسيكية للبنى المتجانسة من أوين (35) وداروين (36) ، المستمدة من اعتبارات الوراثة الجينية والسمات / الهياكل المتأثرة باضطراب الجينات ، المفاهيم التي تندرج في المجال العام لعلم الأحياء التطوري التطوري (evo-devo) (37). توضح أنظمة الجينات المحفوظة التي كشفت عنها الفينولوجيات النباتية الفقارية تماثلًا أقدم من "التماثل العميق" للميتازوان الذي يعد حاليًا محور علم الأحياء التطوري التطوري (26). يجب أن تلفت هذه الفينولوجيات الانتباه إلى مجموعة الأدوات الجزيئية واسعة النطاق المحتملة داخل السلف المشترك الأخير لحقيقة النواة ، والتي سهلت التطور المتوازي للكائنات المعقدة متعددة الخلايا. يوفر هذا النهج المقارن رؤية أعمق وأوسع في نفس الوقت لتطور الحياة ويوجه الطريق إلى توليف أكبر لبيولوجيا التطور التطوري والطب الحديث.


ال السكريات قاعدة بيانات الجينوم (SGD http://www.yeastgenome.org) هي قاعدة بيانات منسقة بخبرة من المعلومات الوظيفية المشتقة من الأدب لنموذج الخميرة المتبرعمة للكائن الحي ، خميرة الخميرة. تسعى SGD باستمرار إلى دمج أنواع جديدة من البيانات التجريبية وتنبؤات المعلوماتية الحيوية مع البيانات الموجودة ، وتنظيمها في مصدر معلومات شامل وحديث. تتمثل المهمة الأساسية لـ SGD في تسهيل البحث في بيولوجيا الخميرة وتوفير هذه الثروة من المعلومات للنهوض ، بعدة طرق ، بالبحث عن الكائنات الحية الأخرى ، حتى تلك البعيدة تطوريًا مثل البشر. لبناء مثل هذا الجسر بين الممالك البيولوجية ، تقوم SGD برعاية البيانات المتعلقة بتكامل الخميرة البشرية ، حيث يمكن للجين البشري أن يحل محل وظيفة جين الخميرة بنجاح ، و / أو العكس. يتم تنظيم هذه البيانات يدويًا من المؤلفات المنشورة ، وإتاحتها للتنزيل ، ودمجها في مجموعة متنوعة من أدوات التحليل التي توفرها SGD.

ال السكريات قاعدة بيانات الجينوم (SGD http://www.yeastgenome.org) هي مورد متاح مجانًا عبر الإنترنت يخدم مجتمع البحث من خلال تنسيق المعرفة حول الجينات والبروتينات الخاصة بالخميرة الناشئة في الكائن الحي ، خميرة الخميرة. كانت الخميرة موضوعًا للدراسات في مجالات علم الوراثة والكيمياء الحيوية وبيولوجيا الخلية لعقود قبل أن تصبح أول حقيقيات النوى بجينوم متسلسل بالكامل (1). أدى توافر تسلسل الجينوم ، المدعوم بجميع المعلومات التي تم جمعها سابقًا ومساعدته في تطوير ترسانة قوية من تقنيات البيولوجيا الجزيئية ، إلى تراكم قدر هائل من المعرفة ، مما يجعل الخميرة ، كما يمكن القول ، واحدة من أكثر أنواع الخميرة تميزًا بدقة الكائنات الحية النموذجية. The constant development of new techniques that are validated and refined on yeast promises that this status will continue into the future.

The mission of SGD is to collect gene- and protein-related information from all publicly available sources. Research articles in scientific journals, expertly curated by SGD biocurators, remain the primary source of data. Large-scale datasets are also collected both manually and with automated scripts from publications, and also from repositories such as the Gene Expression Omnibus (GEO https://www.ncbi.nlm.nih.gov/geo) and Sequence Read Archive (SRA https://www.ncbi.nlm.nih.gov/sra). The goal is to extract, validate, and organize the data coming from various sources into a uniform, comprehensive and up-to-date compendium that researchers can rely on in their work.

The wealth of information provided by SGD can also be leveraged outside of the research into yeast biology. Understanding the functions of a yeast gene may shed light on functions of an orthologous gene in another organism, even one as evolutionary distant as humans. It is often assumed that over the course of evolution, orthologous genes from different organisms retain at least some of their characteristics. Even though this ‘ortholog-function conjecture’ has many known exceptions, it remains a valuable and widely used method for predicting gene functions based on sequence similarity ( 2). Yeast and humans are separated by a billion years of evolution ( 3), yet there are thousands of recognizable orthologs between the two species ( 4). Moreover, there are hundreds of genes from one species that can functionally replace (complement) their orthologs in the other ( 5). Such functional complementation between genes from evolutionarily distant species indicates a significant conservation of function, opening up endless research possibilities to explore. A researcher can, for example, try to identify yeast metabolic pathways, regulatory circuits, or protein complexes the gene of interest is involved in, as well as mutant phenotypes and their potential disease links, and then start looking for similar connections in humans. Moreover, a human gene that functions in yeast cells gives access to all the power of yeast genetics that can be readily utilized. For example, by establishing functional assays, researchers can experimentally dissect functional conservation to study the impact of human disease-associated variants on protein function ( 6).


Human disease and associated phenotype database? - مادة الاحياء

MGD is updated on a weekly basis by biologists on our curatorial staff who scan the current scientific literature, extract relevant data, and enter it in MGD. Increasingly, MGD acquires data through large scale electronic transfer. Such data include sequence data from GenBank, gene models from NCBI, Ensembl, VEGA, mutant alleles from ENU-mutagenesis groups and the International Knockout Mouse Consortium (IKMC). The data interface is intended to be flexible and comprehensive so that each view of particular records in MGD provides links to any related data throughout MGD and, where possible, to other databases on the Internet.

  • Gene, DNA marker, QTL and Cytogenetic marker descriptions
  • Mouse genetic phenotypes, genetic interrelationships, and polymorphic loci
  • Human disease ontology data (DO)
  • Polymorphic loci related to specified strains
  • SNPs and other sequence polymorphisms
  • Vertebrate homology data
  • Sequence data
  • Molecular probes and clones (probes, clones, primers and YACs)
  • Genetic and physical mapping data
  • Information on inbred strains (M. Festing's listing)
  • References supporting all data in MGD

Data Links to External Databases

MGD provides links to relevant information in external databases wherever possible.

Through. MGD links to.
MarkersEC, Ensembl, Entrez, InterPro, NCBI, PDB, UniGene, VEGA
PhenotypesOn-line Mendelian Inheritance in Man (OMIM) for human disease data
SNPs and sequence polymorphisms dbSNP
Homologies Entrez, HGNC, HomoloGene, NCBI, Ensembl Gene Tree, Uniprot, VEGA, VISTA
SequencesGenBank, RefSeq, Uni-PROT, and TrEMBL mouse gene indices
Molecular probes and clonesGenBank, EMBL, DDBJ, IMAGE and RIKEN
مراجعPubMed

Genes and Markers

MGD contains information on mouse genes, DNA segments, cytogenetic markers and QTLs (see Genes and Markers). Each record may include the marker symbol, name, other names or symbols and synonyms, nomenclature history, alleles, STSs, chromosomal assignment, centimorgan location, cytogenetic band, EC number (for enzymes), phenotypic classifications, human disease data, Gene Ontology (GO) terms, MGD accession IDs and supporting references. See Interpreting a Genes and Markers Summary and Interpreting Gene Details for more information about the content of the display of a marker record as it appears in the query results.

Information on alleles , formerly embedded in phenotype descriptions, is stored as a separate data set (see Phenotypic Alleles). Links to alleles are provided in gene detail records. In addition, there is an Phenotypes, Alleles, and Disease Models Query Form for direct queries against the allele data set. See Details for the content of an allele record as displayed in query results.

Phenotypic Alleles

MGD contains information on mutant alleles, transgenes, QTLs, strain characteristics, phenotype vocabularies, human disease models, and comparative phenotypes. Integrated access to phenotype and disease model data is accessible via four query forms (Genes and Markers, Phenotypes and Alleles, Human&mdashMouse: Disease Connection, and Batch Query). These forms provide genetic, phenotypic, and computational approaches to displaying phenotypic variation sources (single-gene, genetic mutations, QTLs, strains), as well as data on human disease correlation, and mouse models. The Human Disease Ontology (DO) Browser enables you to browse and search diseases, conditions, and syndromes directly. Phenotypic allele summary and detail reports provide detailed information about the content of phenotype records including observed phenotypes in mouse and genetic background. The Human Disease and Mouse Model Detail page lists homologous mouse and human markers where mutations in one or both species have been associated with phenotypes characteristic of this disease as well as any mouse models.

Sequence Data

  • Vast amounts of sequence data are integrated with the biological information in MGD. These include mouse sequences from GenBank, RefSeq, and .
  • MGD contains sequence attributes such as length and provider data about the clones the sequences were derived from and the genes the sequences have been associated to. Because of our curated associations between mouse markers and sequences, you can search using nomenclature, map position, function (GO annotation, InterPro domain), expression (tissue and developmental stage), and phenotypes of mutant alleles.
  • Source information about the clones that the sequences are derived from, such as strain, tissue, or library, is carefully translated into controlled vocabularies (see Vocabulary Browsers). This adds enormous power to sequence queries, since authors often use multiple terms to specify a strain or tissue.

Vocabulary Browsers

  • The MGD Vocabulary Browsers provide access to restricted sets of defined terms representing complex information.
  • These vocabularies (known as DAGs أو directed acyclic graphs) have a tree (or hierarchical) structure: terms are organized primarily by their relationship to other terms.
  • The MGD Vocabulary Browsers currently available are:

Browser NameUse this browser to search for .
GO (Gene Ontology) Browser GO term details and relationships.
Links to genes associated with your term or with any sub terms.
Mouse Developmental Anatomy Browser Anatomical structures.
Links to associated expression results.
Disease Ontology (DO) BrowserHuman disease terms.
Links to detail pages containing genotypes annotated with these terms.
Links to Disease Model web pages.
Mammalian Phenotype Browser Mammalian phenotype terms.
Term details and relationships among terms.
Links to genotypes annotated with each term or any sub terms.
Human Phenotype Browser Human phenotype terms.
Term details and relationships among terms.
Links to human diseases and the high-level human phenotype terms associated with the term.

SNP Data

  • MGD provides comprehensive information about reference SNPs including the reference flanking sequence, assays that comprise the SNP, gene/marker associations with their corresponding function class annotations, and links to popular gene browsers including Mouse Genome Browser and its transcript, gene model, and MGD-curated phenotype and allele tracks.
  • The Mouse SNP Query Form lets you search for RefSNPs by strains, strain comparisons, RefSNP attributes, map position, marker range, or associated genes.

Molecular Probes and Clones

Probes, clones, primers, antibodies, etc. associated with MGI data for a gene or genome feature are available via a Molecular reagents link on Gene (or genome feature) Detail pages or from a link on References -- Query Results Detail pages to Molecular Probes and Clones.

Information on genetic polymorphisms is extracted from probe/clone records in MGD.

Vertebrate Homology

MGD contains homology information for mouse, human, rat, cattle and other vertebrate organisms.

MGI provides a curated set of vertebrate homologs for the research community. MGI focuses on integration of homology sets from sequenced vertebrate genomes (e.g., human, rat, dog, chimp). MGI loads sequence based vertebrate homology assertions from NCBI HomoloGene. HomoloGene programmatically detects homologs among the genome features of several completely sequenced eukaryotic genomes. In addition, we continue to work with the research community to carefully curate gene family sets, usually at the instigation of the research community.

Homologous genes associated with a mouse gene or genome feature are available from via links from the Vertebrate Homology section a Detail page for a gene/genome feature. Performing a Quick Search using a non-mouse gene or sequence accession ID returns a link to the Vertebrate Homology Class page.

Mapping Data

MGD contains genetic mapping and linkage data, including haplotype data for linkage crosses, فى الموقع hybridization data, deletion mapping information, translocation breakpoint mapping, somatic cell hybrids, concordance tables, congenic strains information, and physical mapping information.

Centimorgan positions for genes and markers in MGI are based on linear interpolation using the standard genetic map described in Cox et al. (2009) (PMID).

"Recombinant Congenic Strains - A New Tool for Analyzing Genetic Traits Determined by More Than One Gene," Immunogenetics 24: 416-422, 1986.

DNA Mapping Panel Data Sets

    Copeland-Jenkins:(C57BL/6J x M. spretus)F1 x C57BL/6J
    JAX Mouse Mutant Resource BCB: (C57BL/6J x CAST/Ei)F1 x C57BL/6J
    JAX Mouse Mutant Resource BSS: (C57BL/6J x SPRET/Ei)F1 x SPRET/Ei
    Kozak FvC58: (NFS/N x M. spretus)F1 x C58/J Kozak FvSpr: (NFS/N x M. spretus)F1 x M. spretus
    Kozak Skive: (NFS/N or C58/J x M. m. musculus)F1 x M. m. العضلات
    Seldin: (C3H/HeJ-Fasl<gld> x M. spretus)F1 x C3H/HeJ-Fasl<gld>
    UCLA (BSB): (C57BL/6J x M. spretus)F1 x C57BL/6J

DNA Mapping Panel data may appear in tabular format, where each column represents a single offspring of the cross, and each row indicates, for each locus, which allele is present in each of the offspring. The order of rows is determined by linkage on the chromosome, and the locus nearest the centromere appears at the top of the display. Centimorgan locations for loci in the cross are determined by the provider of the cross. -->

Graphical Map Displays

الخرائط الجينية

Where available, gene/genome feature detail pages provide a link to a Detailed Genetic Map that shows all markers within one cM of the marker.


Cite this

  • APA
  • مؤلف
  • BIBTEX
  • هارفارد
  • اساسي
  • RIS
  • فانكوفر

The Human Phenotype Ontology project : linking molecular biology and disease through phenotype data. / Köhler, Sebastian Doelken, Sandra C Mungall, Christopher J Bauer, Sebastian Firth, Helen V Bailleul-Forestier, Isabelle Black, Graeme C M Brown, Danielle L Brudno, Michael Campbell, Jennifer Fitzpatrick, David R Eppig, Janan T Jackson, Andrew P Freson, Kathleen Girdea, Marta Helbig, Ingo Hurst, Jane A Jähn, Johanna Jackson, Laird G Kelly, Anne M Ledbetter, David H Mansour, Sahar Martin, Christa L Moss, Celia Mumford, Andrew Ouwehand, Willem H Park, Soo-Mi Riggs, Erin Rooney Scott, Richard H Sisodiya, Sanjay Vooren, Steven Van Wapner, Ronald J Wilkie, Andrew O M Wright, Caroline F Vulto-van Silfhout, Anneke T Leeuw, Nicole de de Vries, Bert B A Washingthon, Nicole L Smith, Cynthia L Westerfield, Monte Schofield, Paul Ruef, Barbara J Gkoutos, Georgios V Haendel, Melissa Smedley, Damian Lewis, Suzanna E Robinson, Peter N.


الانتماءات

Raymond G. Perelman Center for Cellular and Molecular Therapeutics, Children’s Hospital of Philadelphia, Philadelphia, PA, 19104, USA

James M. Havrilla, Xiangchen Dong & Kai Wang

Department of Biomedical Informatics, Columbia University Irving Medical Center, New York, NY, 10032, USA

Department of Pathology and Laboratory Medicine, University of Pennsylvania Perelman School of Medicine, Philadelphia, PA, 19104, USA

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

يمكنك أيضًا البحث عن هذا المؤلف في PubMed Google Scholar

مساهمات

JH and KW conceived and designed the project. XD provided help with the initial site design. CL helped JH integrate Doc2HPO and Elasticsearch. JH wrote the draft manuscript and created all the figures and case studies. JH designed the site and algorithms and gathered resources. كل الكتاب قراءة وافقت على المخطوط النهائي.

المؤلف المراسل


شاهد الفيديو: الحلقة. 4. الوراثة البشرية حالة السائدة + طريقة تحديد الانماط + غير مرتبط بالجنس (يونيو 2022).


تعليقات:

  1. Vudonos

    بالتاكيد. أنضم إلى كل ما سبق.

  2. Lange

    من غير المجدي.

  3. Meztir

    أعتذر ، لكن هل يمكنك تقديم المزيد من المعلومات.

  4. Acolmixtli

    لطيف =) رائع ، رائع فقط ، لم أرغب في كتابة تعليق غبي ، لكن رأسي كان مليئًا بتحليل ما قرأته

  5. Demothi

    فكرة رائعة وفي الوقت المناسب



اكتب رسالة