Interbull Quality Service

Υπηρεσία Αποτίμησης Ποιότητας σε Αποτελέσματα Γενετικών Αξιολογήσεων

Στόχος

interbull_logoΣτόχος του έργου είναι η διερεύνηση των δυνατοτήτων για την ανάπτυξη ενός προειδοποιητικού συστήματος βασισμένου στα αποτελέσματα της εφαρμογής εξόρυξης δεδομένων σε γεντικές αξιολογήσεις ταύρων, για την αποτίμηση και διασφάλιση της ποιότητας των δεδομένων. Η τεχνική που χρησιμποιείται συνδυάζει μεθόδους ταξινόμησης και δένδρων αποφάσεων από την εξόρυξη δεδομένων, συναρτήσεις ελέγχου κανονικότητας των δεδομένων, καθώς και δοκιμές υποθέσεων (hypothesis tests).

Περιγραφή Έργου

Τα δεδομένα είναι τριμηνιαίες εθνικές γεντικές αξιολογήσεις, που υπολογίστηκαν μεταξύ του Φεβρουαρίου 1999 και Φεβρουαρίου 2003 σε εννέα χώρες. Κάθε σύνολο αξιολογήσεων περιέχει 73.000-90.000 πεδία ταύρων συμπληρωμένα με τις γενετικές τους αξίες, καθώς και πληροφορία για την αξιολόγησή τους. Τα γνωρίσματα που αξιολογούνται είναι το γάλα των θυγατέρων τους, το λίπος, και η πρωτεΐνη τους.

Οι αλγόριθμοι εξόρυξης δεδομένων εφαρμόζονται ξεχωριστά για κάθε χώρα και σύνολο αξιολογήσεων για την εύρεση συσχετίσεων σε διάφορες διαστάσεις, συμπεριλαμβανομένων του τύπου γενετικής αξίας, της ηλικίας του ταύρου, και του αριθμού των θυγατέρων του. Έπειτα, τα δεδομένα σε κάθε κόμβο προσαρμόζοντια σε μία κανονική κατανομή, και η ποιότητα της προσαρμογής μετράται, δίνοντας έτσι ένα μέτρο για την ποιότητα των δεδομένων.

Για την αξιολόγηση και την τελική πρόβλεψη των μοντέλων δένδρων-απόφασης, η αρχιτεκτονική που υλοποιείται μπορεί να συγκρίνει τις πιθανότητες σε αντίστοιχους κόμβους, μεταξύ δύο μοντέλων και να αποφασίσει για την ομοιότητά τους, με χρήση δοκιμών υποθέσεων για την διακύμανση της κατανομής τους. Η κύρια χρησιμότητα του συστήματος αυτού είναι η δυνατότητά του να αναγνωρίζει τον ακριβή κόμβο όπου καταγράφονται ανωμαλίες, και να εκπέμπει συναγερμό δείχνοντας στα λανθασμένα δεδομένα.