
مقایسه عملکرد هوش مصنوعی و پزشکان در تشخیص بیماریها
یک مطالعه جدید به بررسی نحوه عملکرد هوش مصنوعی مولد در مقایسه با پزشکان در تشخیص شرایط پزشکی پرداخته است. این تحقیق توسط گروهی از محققان در دانشگاه شهر اوزاکا، به رهبری دکتر هیروتاکا تاکیتا و دانشیار دایجو اوئدا، انجام شده است. این بررسی سیستماتیک و تحلیل فراتحلیلی، از میان 18371 مطالعه، 83 مطالعه را برای تجزیهوتحلیل دقیق انتخاب کرده است.
این تحقیق به نقاط قوت و ضعف هوش مصنوعی در حوزه سلامت پرداخته و مدلهای مختلف هوش مصنوعی مولد مانند GPT-4، Llama3 70B، Gemini 1.5 Pro و Claude 3 Sonnet را در زمینههای پزشکی متفاوت بررسی کرده است. GPT-4 بیشترین میزان مطالعه را به خود اختصاص داده است. در مجموع، میزان دقت این مدلهای هوش مصنوعی در تشخیص بیماریها به طور میانگین 52.1 درصد گزارش شده است.
برخی از این مدلها عملکردی مشابه پزشکان غیرمتخصص داشتهاند و اختلاف آماری قابلتوجهی بین آنها مشاهده نشده است (اختلاف دقت: 0.6 درصد). با این حال، پزشکان متخصص همچنان عملکرد بهتری از هوش مصنوعی داشتهاند و 15.8 درصد دقت بیشتری ارائه دادهاند. این مطالعه نشان داده که هوش مصنوعی در برخی رشتههای پزشکی مانند درماتولوژی نتایج بهتری ارائه کرده است، زیرا این حوزه بیشتر بر الگوهای بصری تمرکز دارد که هوش مصنوعی در آن مهارت بالایی دارد.
اما در اورولوژی عملکرد ضعیفتری داشته که به دلیل استفاده از یک مطالعه گسترده منفرد در این زمینه بوده است. محققان معتقدند که این سیستم میتواند در آموزش پزشکی نقش مؤثری داشته باشد و به پزشکان غیرمتخصص و دانشجویان پزشکی کمک کند تا مهارتهای خود را ارتقا دهند. با این حال، همچنان نگرانیهایی در مورد شفافیت و سوگیری وجود دارد، زیرا بسیاری از مدلهای هوش مصنوعی اطلاعات دقیقی درباره دادههای آموزشی خود ارائه نمیدهند.
با توجه به پیشرفتهای اخیر، این احتمال وجود دارد که هوش مصنوعی در آینده به ابزار مکمل برای تشخیص پزشکی تبدیل شود. آیا پزشکان باید نگران از دست دادن شغل خود باشند؟ پاسخ به این سوال هنوز مشخص نیست، اما پیشرفتهای فعلی نشان میدهد که این فناوری در حال نزدیک شدن به عملکرد پزشکان متخصص است.