Μια νέα έρευνα σχετικά με το GPT-4 της Open AI επιχειρεί να αποκαλύψει την ποιότητα των απαντήσεων που δίνει σε ερωτήσεις για θέματα υγείας. Οι ερευνητές χρησιμοποιήσαν 195 σχετικά ερωτήματα που είχαν αναρτηθεί στο Reddit r/AskDocs και είχαν απαντηθεί από πιστοποιημένους επαγγελματίες υγείας. Στη συνέχεια έθεσαν τα ίδια ερωτήματα στο GPT-4 και μια ομάδα ειδικών ανέλαβε τη σύγκριση και την αξιολόγηση των απαντήσεων.Όσον αφορά την ποιότητα των πληροφοριών, το σύστημα Τεχνητής Νοημοσύνης έλαβε ένα σκορ 4,13 κατά μέσο όρο, με τις απαντήσεις να αξιολογούνται ως «καλές» και «πολύ καλές». Οι απαντήσεις των γιατρών πέτυχαν σκορ 3,26 και χαρακτηρίστηκαν «αποδεκτές».
Το πιο εντυπωσιακό όμως είναι ότι αξιολογήθηκε και το ύφος των απαντήσεων αναφορικά με την ενσυναίσθηση, και πάλι το GPT-4 πέτυχε καλύτερο σκορ. Οι ειδικοί έδωσαν το βαθμό 3,65 έναντι του 2,15 των γιατρών που φαίνεται ότι απάντησαν «με λίγη ενσυναίσθηση». Συνολικά, οι αξιολογητές φαίνεται πως προτίμησαν τις απαντήσεις του GPT-4 κατά 78,6% σε σύγκριση με τις απαντήσεις των γιατρών.
Οι ερευνητές, που δημοσίευσαν τα αποτελέσματά τους στο JAMA Internal Medicine, καταλήγουν στο συμπέρασμα ότι τα προγράμματα ανταλλαγής μηνυμάτων Τεχνητής Νοημοσύνης μπορούν με ασφάλεια να χρησιμοποιηθούν από συστήματα και δομές υγείας, με τους γιατρούς απλώς να εποπτεύουν τις απαντήσεις. Έτσι θα απελευθερώνεται πολύτιμος χρόνος για να απασχολούνται με πιο σοβαρά και περίπλοκα περιστατικά.