Sejak IBM Watson dimulai pada tahun 2007, manusia terus mengembangkan kecerdasan buatan (AI) medis. Sistem AI medis yang andal dan berdaya guna memiliki potensi besar untuk mengubah semua aspek kedokteran modern, memungkinkan perawatan yang lebih cerdas, lebih akurat, efisien, dan inklusif, meningkatkan kesejahteraan tenaga medis dan pasien, dan dengan demikian meningkatkan kesehatan manusia secara signifikan. Dalam 16 tahun terakhir, meskipun para peneliti AI medis telah berakumulasi di berbagai bidang kecil, pada tahap ini, mereka belum mampu mewujudkan fiksi ilmiah menjadi kenyataan.
Tahun ini, dengan perkembangan revolusioner teknologi AI seperti ChatGPT, AI medis telah membuat kemajuan besar dalam banyak aspek. Terobosan yang belum pernah terjadi sebelumnya dalam kemampuan AI medis: Jurnal Nature terus meluncurkan penelitian model bahasa besar medis dan model dasar citra medis; Google merilis Med-PaLM dan penggantinya, mencapai tingkat ahli dalam pertanyaan ujian Praktisi medis AS. Jurnal akademik utama akan fokus pada AI medis: Nature merilis pandangan tentang model dasar AI medis umum; Setelah serangkaian ulasan AI dalam Kedokteran awal tahun ini, New England Journal of Medicine (NEJM) menerbitkan ulasan kesehatan digital pertamanya pada 30 November, dan meluncurkan edisi pertama sub-jurnal NEJM NEJM AI pada 12 Desember. Lahan pendaratan AI medis semakin matang: Sub-jurnal JAMA menerbitkan inisiatif berbagi data citra medis global; Badan Pengawas Obat dan Makanan AS (FDA) sedang mengembangkan rancangan pedoman untuk regulasi AI medis.
Di bawah ini, kami meninjau kemajuan signifikan yang telah dicapai oleh para peneliti di seluruh dunia dalam arah AI medis yang dapat digunakan pada tahun 2023
Model Dasar AI Medis
Konstruksi model dasar AI medis tidak diragukan lagi menjadi fokus penelitian terhangat tahun ini. Jurnal Nature telah menerbitkan artikel ulasan tentang model dasar universal perawatan kesehatan dan model bahasa besar perawatan kesehatan sepanjang tahun. Medical Image Analysis, jurnal terkemuka di industri ini, meninjau dan mengantisipasi tantangan serta peluang penelitian model dasar dalam analisis citra medis, dan mengusulkan konsep "silsilah model dasar" untuk merangkum dan memandu pengembangan penelitian model dasar AI medis. Masa depan model AI dasar untuk perawatan kesehatan semakin jelas. Berdasarkan contoh-contoh sukses model bahasa besar seperti ChatGPT, menggunakan metode pra-pelatihan mandiri yang lebih canggih dan akumulasi data pelatihan yang luas, para peneliti di bidang AI medis mencoba membangun 1) model dasar spesifik penyakit, 2) model dasar umum, dan 3) model besar multimoda yang mengintegrasikan berbagai moda dengan parameter masif dan kemampuan superior.
Model AI Akuisisi Data Medis
Selain model AI berskala besar yang berperan penting dalam tugas analisis data klinis hilir, teknologi yang diwakili oleh model AI generatif juga telah muncul dalam akuisisi data klinis hulu. Algoritma AI dapat meningkatkan proses, kecepatan, dan kualitas akuisisi data secara signifikan.
Awal tahun ini, Nature Biomedical Engineering menerbitkan sebuah studi dari Universitas Straits Turki yang berfokus pada penggunaan AI generatif untuk memecahkan masalah diagnosis berbantuan gambar patologis dalam aplikasi klinis. Artefak dalam jaringan potongan beku selama operasi merupakan hambatan untuk evaluasi diagnostik yang cepat. Meskipun jaringan yang tertanam formalin dan parafin (FFPE) memberikan sampel berkualitas lebih tinggi, proses produksinya memakan waktu dan seringkali memakan waktu 12-48 jam, sehingga tidak cocok untuk digunakan dalam operasi. Oleh karena itu, tim peneliti mengusulkan sebuah algoritma yang disebut AI-FFPE, yang dapat membuat tampilan jaringan dalam potongan beku mirip dengan FFPE. Algoritma tersebut berhasil mengoreksi artefak potongan beku, meningkatkan kualitas gambar, dan mempertahankan fitur yang relevan secara klinis pada saat yang bersamaan. Dalam validasi klinis, algoritma AI-FFPE secara signifikan meningkatkan akurasi diagnostik ahli patologi untuk subtipe tumor, sementara secara signifikan mempersingkat waktu diagnosis klinis.
Cell Reports Medicine melaporkan sebuah karya penelitian oleh tim dari Third Clinical College of Jilin University, Departemen Radiologi, Rumah Sakit Zhongshan yang berafiliasi dengan Fudan University, dan Shanghai University of Science and Technology [25]. Studi ini mengusulkan kerangka kerja fusi rekonstruksi iteratif dan pembelajaran mendalam tujuan umum (Hybrid DL-IR) dengan fleksibilitas dan keserbagunaan tinggi, menunjukkan kinerja rekonstruksi gambar yang sangat baik dalam MRI cepat, CT dosis rendah, dan PET cepat. Algoritme tersebut dapat mencapai pemindaian multi-urutan organ tunggal MR dalam 100 detik, mengurangi dosis radiasi menjadi hanya 10% dari gambar CT, dan menghilangkan noise, dan dapat merekonstruksi lesi kecil dari akuisisi PET dengan akselerasi 2 hingga 4 kali, sambil mengurangi efek artefak gerakan.
AI Medis Berkolaborasi dengan Tenaga Medis
Perkembangan pesat AI medis juga telah mendorong para profesional medis untuk secara serius mempertimbangkan dan mengeksplorasi cara berkolaborasi dengan AI untuk meningkatkan proses klinis. Pada bulan Juli tahun ini, DeepMind dan tim peneliti multi-institusi bersama-sama mengusulkan sistem AI yang disebut Complementary Driven Clinical Workflow Delay (CoDoC). Proses diagnostik pertama-tama didiagnosis oleh sistem AI prediktif, kemudian dinilai oleh sistem AI lain pada hasil sebelumnya, dan jika ada keraguan, diagnosis akhirnya dibuat oleh dokter untuk meningkatkan akurasi diagnostik dan efisiensi keseimbangan. Dalam hal skrining kanker payudara, CoDoC mengurangi tingkat positif palsu sebesar 25% dengan tingkat negatif palsu yang sama, sekaligus mengurangi beban kerja dokter sebesar 66%, dibandingkan dengan proses "arbitrase pembacaan ganda" saat ini di Inggris. Dalam hal klasifikasi TB, tingkat positif palsu berkurang sebesar 5 hingga 15 persen dengan tingkat negatif palsu yang sama dibandingkan dengan AI independen dan alur kerja klinis.
Demikian pula, Annie Y. Ng et al., dari Kheiron Company di London, Inggris, memperkenalkan pembaca AI tambahan (bekerja sama dengan pemeriksa manusia) untuk memeriksa ulang hasil ketika tidak ada hasil recall dalam proses arbitrase pembacaan ganda, yang memperbaiki masalah deteksi yang terlewat dalam skrining kanker payudara dini, dan prosesnya hampir tidak memiliki hasil positif palsu. Studi lain, yang dipimpin oleh tim di University of Texas McGovern Medical School dan diselesaikan di empat pusat stroke, menerapkan teknologi AI berbasis computed tomography angiography (CTA) untuk mengotomatiskan deteksi stroke iskemik oklusif vaskular besar (LVO). Dokter dan ahli radiologi menerima peringatan real-time di ponsel mereka dalam beberapa menit setelah pencitraan CT selesai, memberi tahu mereka tentang kemungkinan adanya LVO. Proses AI ini meningkatkan alur kerja di rumah sakit untuk stroke iskemik akut, mengurangi waktu door-to-groin dari penerimaan hingga perawatan dan memberikan peluang untuk penyelamatan yang berhasil. Temuan ini dipublikasikan di JAMA Neurology.
Model Layanan Kesehatan AI untuk Manfaat Universal
Tahun 2023 juga akan menyaksikan banyak karya bagus yang menggunakan AI medis untuk menemukan fitur-fitur yang tak kasat mata dari data yang lebih mudah diakses, memungkinkan diagnosis universal dan skrining dini berskala besar. Di awal tahun, Nature Medicine menerbitkan studi yang dilakukan oleh Zhongshan Eye Center, Sun Yat-sen University, dan Second Affiliated Hospital, Fujian Medical University. Menggunakan ponsel pintar sebagai terminal aplikasi, mereka menggunakan gambar video seperti kartun untuk menginduksi pandangan anak-anak dan merekam perilaku pandangan serta fitur wajah anak-anak. Mereka juga menganalisis lebih lanjut model abnormal menggunakan model pembelajaran mendalam untuk mengidentifikasi 16 penyakit mata, termasuk katarak kongenital, ptosis kongenital, dan glaukoma kongenital, dengan akurasi skrining rata-rata lebih dari 85%. Hal ini menyediakan sarana teknis yang efektif dan mudah dipopulerkan untuk skrining dini berskala besar terhadap gangguan fungsi penglihatan bayi dan penyakit mata terkait.
Pada akhir tahun, Nature Medicine melaporkan sebuah penelitian yang dilakukan oleh lebih dari 10 institusi medis dan riset di seluruh dunia, termasuk Shanghai Institute of Pancreatic Disease dan First Affiliated Hospital of Zhejiang University. Penulis menerapkan AI pada skrining kanker pankreas pada individu tanpa gejala di pusat pemeriksaan fisik, rumah sakit, dll., untuk mendeteksi fitur lesi pada gambar CT scan polos yang sulit dideteksi dengan mata telanjang saja, sehingga mencapai deteksi dini kanker pankreas yang efisien dan non-invasif. Dalam meninjau data dari lebih dari 20.000 pasien, model tersebut juga mengidentifikasi 31 kasus lesi yang terlewat secara klinis, yang secara signifikan meningkatkan luaran klinis.
Berbagi Data Medis
Pada tahun 2023, semakin banyak mekanisme berbagi data yang sempurna dan kasus-kasus yang berhasil telah muncul di seluruh dunia, memastikan kerja sama multi-pusat dan keterbukaan data dengan premis melindungi privasi dan keamanan data.
Pertama, dengan bantuan teknologi AI itu sendiri, para peneliti AI telah berkontribusi pada berbagi data medis. Qi Chang dan rekan-rekannya dari Rutgers University di Amerika Serikat menerbitkan sebuah artikel di Nature Communications, yang mengusulkan kerangka kerja pembelajaran federal (DSL) berbasis jaringan adversarial sintetis terdistribusi. Jaringan ini menggunakan AI generatif untuk melatih data spesifik yang dihasilkan dari multisenter, lalu mengganti data nyata dari multisenter dengan data yang dihasilkan. Hal ini memastikan pelatihan AI berbasis big data multisenter sekaligus melindungi privasi data. Tim yang sama juga membuka sumber data kumpulan gambar patologis yang dihasilkan beserta anotasinya. Model segmentasi yang dilatih berdasarkan kumpulan data yang dihasilkan dapat mencapai hasil yang serupa dengan data nyata.
Tim Dai Qionghai dari Universitas Tsinghua menerbitkan makalah tentang npj Digital Health, mengusulkan Relay Learning, yang menggunakan data besar multi-situs untuk melatih model AI di bawah premis kedaulatan data lokal dan tidak ada koneksi jaringan lintas situs. Ini menyeimbangkan masalah keamanan dan privasi data dengan mengejar kinerja AI. Tim yang sama kemudian bersama-sama mengembangkan dan memvalidasi CAIMEN, sistem diagnosis tumor pan-mediastinum CT dada berdasarkan pembelajaran federal, bekerja sama dengan Rumah Sakit Afiliasi Pertama Universitas Kedokteran Guangzhou dan 24 rumah sakit di seluruh negeri. Sistem ini, yang dapat diterapkan pada 12 tumor mediastinum umum, mencapai akurasi 44,9 persen lebih baik ketika digunakan sendiri daripada ketika digunakan oleh para ahli manusia saja, dan akurasi diagnosis 19 persen lebih baik ketika para ahli manusia dibantu olehnya.
Di sisi lain, beberapa inisiatif sedang dilakukan untuk membangun set data medis yang aman, global, dan berskala besar. Pada November 2023, Agustina Saenz dan rekan-rekannya dari Departemen Informatika Biomedis di Harvard Medical School menerbitkan secara daring di Lancet Digital Health sebuah kerangka kerja global untuk berbagi data citra medis yang disebut Data Kecerdasan Buatan untuk Semua Layanan Kesehatan (MAIDA). Mereka bekerja sama dengan organisasi layanan kesehatan di seluruh dunia untuk memberikan panduan komprehensif tentang pengumpulan dan de-identifikasi data, menggunakan templat Mitra Demonstrasi Federal AS (FDP) untuk menstandardisasi pembagian data. Mereka berencana untuk merilis set data yang dikumpulkan di berbagai wilayah dan pengaturan klinis di seluruh dunia secara bertahap. Set data pertama diperkirakan akan dirilis pada awal 2024, dengan lebih banyak lagi yang akan dirilis seiring dengan perluasan kemitraan. Proyek ini merupakan upaya penting untuk membangun kumpulan data AI yang tersedia untuk umum secara global, berskala besar, dan beragam.
Menyusul proposal tersebut, UK Biobank telah memberikan contoh. Pada 30 November, UK Biobank merilis data baru dari pengurutan genom lengkap (whole genome sequencing) 500.000 partisipannya. Basis data ini, yang mempublikasikan urutan genom lengkap dari masing-masing 500.000 relawan Inggris, merupakan basis data genom manusia lengkap terbesar di dunia. Para peneliti di seluruh dunia dapat meminta akses ke data yang telah dideidentifikasi ini dan menggunakannya untuk menyelidiki dasar genetik kesehatan dan penyakit. Data genetik selalu sangat sensitif untuk verifikasi di masa lalu, dan pencapaian bersejarah UK Biobank ini membuktikan bahwa membangun basis data global berskala besar yang terbuka dan bebas privasi adalah hal yang mungkin. Dengan teknologi dan basis data ini, AI medis pasti akan mengantarkan lompatan berikutnya.
Verifikasi dan Evaluasi AI Medis
Dibandingkan dengan perkembangan pesat teknologi AI medis itu sendiri, perkembangan verifikasi dan evaluasi AI medis terbilang lambat. Validasi dan evaluasi di bidang AI umum seringkali mengabaikan kebutuhan nyata klinisi dan pasien akan AI. Uji klinis terkontrol acak tradisional terlalu rumit untuk mengimbangi iterasi cepat perangkat AI. Meningkatkan sistem verifikasi dan evaluasi yang sesuai untuk perangkat AI medis sesegera mungkin merupakan hal terpenting untuk mendorong AI medis agar benar-benar melampaui tahap penelitian dan pengembangan menuju tahap klinis.
Dalam makalah penelitian Google tentang Med-PaLM yang diterbitkan di Nature, tim tersebut juga menerbitkan tolok ukur evaluasi MultiMedQA, yang digunakan untuk menilai kemampuan model bahasa besar dalam memperoleh pengetahuan klinis. Tolok ukur ini menggabungkan enam set data Tanya Jawab medis profesional yang sudah ada, yang mencakup pengetahuan medis profesional, penelitian, dan aspek lainnya, serta set data basis data pertanyaan medis pencarian daring, yang mempertimbangkan Tanya Jawab daring antara dokter dan pasien, dan mencoba melatih AI menjadi dokter yang berkualifikasi dari berbagai aspek. Selain itu, tim tersebut mengusulkan kerangka kerja berbasis penilaian manusia yang mempertimbangkan berbagai dimensi fakta, pemahaman, penalaran, dan potensi bias. Ini merupakan salah satu upaya penelitian paling representatif untuk mengevaluasi AI dalam layanan kesehatan yang diterbitkan tahun ini.
Namun, apakah fakta bahwa model bahasa besar menunjukkan tingkat pengkodean pengetahuan klinis yang tinggi berarti bahwa model bahasa besar kompeten untuk tugas klinis dunia nyata? Sama seperti mahasiswa kedokteran yang lulus ujian dokter profesional dengan skor sempurna masih jauh dari menjadi dokter kepala tunggal, kriteria evaluasi yang diusulkan oleh Google mungkin bukan jawaban yang sempurna untuk topik evaluasi AI medis untuk model AI. Pada awal tahun 2021 dan 2022, para peneliti telah mengusulkan pedoman pelaporan seperti Decid-AI, SPIRIT-AI, dan INTRPRT, dengan harapan dapat memandu pengembangan awal dan validasi AI medis dengan mempertimbangkan faktor-faktor seperti kepraktisan klinis, keamanan, faktor manusia, dan transparansi/interpretabilitas. Baru-baru ini, jurnal Nature Medicine menerbitkan sebuah studi oleh para peneliti dari Universitas Oxford dan Universitas Stanford tentang apakah akan menggunakan "validasi eksternal" atau "validasi lokal berulang." untuk memvalidasi alat AI.
Sifat perangkat AI yang tidak bias juga merupakan arah evaluasi penting yang telah mendapat perhatian tahun ini, baik dari artikel Science maupun NEJM. AI seringkali menunjukkan bias karena terbatas pada data pelatihan. Bias ini dapat mencerminkan ketidaksetaraan sosial, yang selanjutnya berkembang menjadi diskriminasi algoritmik. National Institutes of Health baru-baru ini meluncurkan inisiatif Bridge2AI, yang diperkirakan menelan biaya $130 juta, untuk membangun beragam kumpulan data (sejalan dengan tujuan inisiatif MAIDA yang disebutkan di atas) yang dapat digunakan untuk memvalidasi ketidakbiasannya perangkat AI medis. Aspek-aspek ini tidak dipertimbangkan oleh MultiMedQA. Pertanyaan tentang bagaimana mengukur dan memvalidasi model AI medis masih membutuhkan diskusi yang ekstensif dan mendalam.
Pada bulan Januari, Nature Medicine menerbitkan opini berjudul "Generasi Berikutnya Kedokteran Berbasis Bukti" dari Vivek Subbiah dari University of Texas MD Anderson Cancer Center, yang mengulas keterbatasan uji klinis yang terungkap dalam konteks pandemi COVID-19 dan menunjukkan kontradiksi antara inovasi dan kepatuhan terhadap proses penelitian klinis. Terakhir, artikel tersebut menunjukkan masa depan restrukturisasi uji klinis – generasi berikutnya dari uji klinis yang menggunakan kecerdasan buatan, yaitu penggunaan kecerdasan buatan dari sejumlah besar data penelitian historis, data dunia nyata, data klinis multi-moda, dan data perangkat yang dapat dikenakan untuk menemukan bukti kunci. Apakah ini berarti bahwa teknologi AI dan proses validasi klinis AI dapat saling memperkuat dan berkembang bersama di masa depan? Inilah pertanyaan terbuka dan menggugah pikiran di tahun 2023.
Regulasi AI Medis
Kemajuan teknologi AI juga menimbulkan tantangan bagi regulasi AI, dan para pembuat kebijakan di seluruh dunia meresponsnya dengan cermat dan hati-hati. Pada tahun 2019, FDA pertama kali menerbitkan Kerangka Regulasi yang Diusulkan untuk Perubahan Perangkat Lunak pada Perangkat Medis Kecerdasan Buatan (Draf Diskusi), yang merinci pendekatan potensialnya terhadap tinjauan pra-pasar modifikasi perangkat lunak berbasis AI dan pembelajaran mesin. Pada tahun 2021, FDA mengusulkan "Perangkat Lunak Berbasis Kecerdasan Buatan/Pembelajaran Mesin sebagai Rencana Aksi Perangkat Medis", yang mengklarifikasi lima langkah regulasi medis AI yang spesifik. Tahun ini, FDA menerbitkan kembali Pengajuan Pra-pasar untuk Fitur Perangkat Lunak Perangkat untuk memberikan informasi tentang rekomendasi pengajuan pra-pasar untuk evaluasi FDA atas keamanan dan kemanjuran fitur perangkat lunak perangkat, termasuk beberapa fitur perangkat lunak yang menggunakan model pembelajaran mesin yang dilatih melalui metode pembelajaran mesin. Kebijakan regulasi FDA telah berkembang dari proposal awal menjadi panduan praktis.
Menyusul publikasi European Health Data Space pada Juli tahun lalu, Uni Eropa kembali mengesahkan Undang-Undang Kecerdasan Buatan. Undang-Undang pertama bertujuan untuk memanfaatkan data kesehatan secara optimal guna menyediakan layanan kesehatan berkualitas tinggi, mengurangi ketimpangan, dan mendukung data untuk pencegahan, diagnosis, pengobatan, inovasi ilmiah, pengambilan keputusan, dan legislasi, sekaligus memastikan warga negara Uni Eropa memiliki kendali yang lebih besar atas data kesehatan pribadi mereka. Undang-Undang kedua menegaskan bahwa sistem diagnosis medis merupakan sistem AI berisiko tinggi, dan perlu mengadopsi supervisi yang kuat dan terarah, supervisi siklus hidup menyeluruh, dan supervisi pra-evaluasi. Badan Obat-obatan Eropa (EMA) telah menerbitkan Draf Makalah Refleksi tentang penggunaan AI untuk mendukung pengembangan, regulasi, dan penggunaan obat, dengan penekanan pada peningkatan kredibilitas AI untuk memastikan keselamatan pasien dan integritas hasil penelitian klinis. Secara keseluruhan, pendekatan regulasi Uni Eropa secara bertahap mulai terbentuk, dan detail implementasi akhir mungkin akan lebih rinci dan ketat. Berbeda sekali dengan regulasi ketat Uni Eropa, cetak biru regulasi AI Inggris memperjelas bahwa pemerintah berencana mengambil pendekatan lunak dan tidak memberlakukan rancangan undang-undang baru atau membentuk regulator baru untuk saat ini.
Di Tiongkok, Pusat Peninjauan Teknis Alat Kesehatan (NMPA) dari Badan Administrasi Produk Kesehatan Nasional telah menerbitkan dokumen-dokumen seperti "Poin-Poin Tinjauan Perangkat Lunak Keputusan Berbantuan Pembelajaran Mendalam", "Prinsip-Prinsip Panduan untuk Peninjauan Registrasi Alat Kesehatan Kecerdasan Buatan (Draf untuk Komentar)", dan "Surat Edaran tentang Prinsip-Prinsip Panduan untuk Klasifikasi dan Definisi Produk Perangkat Lunak Medis Kecerdasan Buatan (No. 47 tahun 2021)". Tahun ini, "Ringkasan hasil klasifikasi produk alat kesehatan pertama di tahun 2023" kembali dirilis. Rangkaian dokumen ini memperjelas dan mempermudah pengoperasian definisi, klasifikasi, dan regulasi produk perangkat lunak medis berbasis kecerdasan buatan, serta memberikan panduan yang jelas untuk strategi penentuan posisi dan registrasi produk berbagai perusahaan di industri ini. Dokumen-dokumen ini menyediakan kerangka kerja dan keputusan manajemen untuk regulasi ilmiah alat kesehatan berbasis kecerdasan buatan. Agenda Konferensi Kecerdasan Buatan Medis Tiongkok yang diselenggarakan di Hangzhou pada 21-23 Desember juga akan membahas forum khusus tentang tata kelola medis digital dan pengembangan rumah sakit umum berkualitas tinggi, serta forum pengembangan industri standardisasi teknologi pengujian dan evaluasi alat kesehatan berbasis kecerdasan buatan. Pada saat itu, para pejabat dari Komisi Pembangunan dan Reformasi Nasional dan NMPA akan menghadiri pertemuan tersebut dan mungkin akan merilis informasi baru.
Kesimpulan
Pada tahun 2023, AI medis telah mulai terintegrasi ke dalam seluruh proses hulu dan hilir medis, yang mencakup pengumpulan data rumah sakit, fusi, analisis, diagnosis dan perawatan, serta skrining komunitas. AI medis juga berkolaborasi secara organik dengan tenaga medis/pengendalian penyakit, yang menunjukkan potensi untuk meningkatkan kesejahteraan kesehatan manusia. Penelitian AI medis yang dapat digunakan mulai bermunculan. Di masa depan, kemajuan AI medis tidak hanya bergantung pada perkembangan teknologinya sendiri, tetapi juga membutuhkan kerja sama penuh antara industri, universitas, dan penelitian medis, serta dukungan dari para pembuat kebijakan dan regulator. Kolaborasi lintas domain ini merupakan kunci untuk mencapai layanan medis yang terintegrasi dengan AI, dan tentunya akan mendorong perkembangan kesehatan manusia.
Waktu posting: 30-Des-2023




