قامت شركة جوجل بتحديث ذكائها الاصطناعي المفتوح المصدر MedGemma مع قدرات لتفسير الصور مثل الأشعة المقطعية والرنين المغناطيسي، وأطلقت أيضًا أداة MedASR مفتوحة المصدر لتحويل الكلام إلى نص.
أعلنت شركة التكنولوجيا جوجل عن تحديث لنموذج الذكاء الاصطناعي MedGemma، معززًا الدعم لتطبيقات التصوير الطبي
يدمج نموذج MedGemma 1.5 4B الجديد ملاحظات من مجتمع المطورين لتحسين دعم العديد من أنواع التصوير الطبي، بما في ذلك الصور عالية الأبعاد مثل الأشعة المقطعية والرنين المغناطيسي، وصور علم الأنسجة، والتصوير الطولي مثل سلسلة صور الأشعة على الصدر، ومهام تحديد الموقع التشريحي
كما يحسن فهم المستندات الطبية، مما يتيح استخراج البيانات المنظمة من تقارير المختبرات. مقارنةً بالإصدار السابق MedGemma 1 4B، يوفر تحديث 1.5 4B دقة محسنة للنص، والسجلات الطبية، والصور ثنائية الأبعاد، مع بقائه مضغوطًا بما يكفي للعمل بدون اتصال بالإنترنت
بالنسبة للتطبيقات النصية الأكثر تعقيدًا، يمكن للمطورين الاستمرار في استخدام نموذج MedGemma الأكبر الذي يحتوي على 27 مليار معلمة. تتوفر التفاصيل الكاملة والمعايير في بطاقة نموذج MedGemma 1.5.
تم بناء MedGemma أصلاً كنظام متعدد الوسائط ليعكس بيئة البيانات المعقدة في الطب، مع دعم الإصدارات المبكرة لتفسير الصور الطبية ثنائية الأبعاد مثل الأشعة على الصدر، وصور الأمراض الجلدية، وفحوصات الشبكية، وعينات علم الأنسجة. توسع الإصدار الأخير، MedGemma 1.5، هذه القدرات لتشمل التصوير الطبي عالي الأبعاد، مع دمج بيانات الأشعة المقطعية والرنين المغناطيسي ثلاثية الأبعاد بالإضافة إلى علم الأنسجة كامل الشريحة. يمكن للمطورين الآن إنشاء تطبيقات تعالج شرائح أو أجزاء متعددة من الصور مع مطالبات مخصصة، مما يمكّن من حالات تشخيص وتحليل أكثر تقدمًا.
وفقًا للتقييمات الداخلية، يُظهر MedGemma 1.5 تحسينات ملحوظة في الأداء عبر عدة مجالات، بما في ذلك تصنيف نتائج الأشعة المقطعية والرنين المغناطيسي، وتحليل علم الأنسجة، وتحديد الموقع التشريحي في صور الأشعة على الصدر، ومراجعة الصور الطولية، واستخراج البيانات المنظمة من تقارير المختبرات. كما يُظهر النموذج مكاسب كبيرة في فهم النصوص الطبية وأسئلة وإجابات السجلات الصحية الإلكترونية، مما يعكس تقدمات أوسع في الأداء البصري واللغوي.
يبني هذا التوسع على أدوات جوجل السابقة لأساس الأشعة المقطعية ويمثل واحدًا من أول النماذج المفتوحة متعددة الوسائط المتاحة علنًا القادرة على التعامل مع البيانات الطبية عالية الأبعاد بجانب النصوص التقليدية والصور ثنائية الأبعاد. على الرغم من أن هذه الميزات لا تزال تتطور، تتوقع الشركة أن يحقق المطورون تحسينات إضافية من خلال التخصيص في المجال، مدعومًا بدروس وموارد جديدة لإستخدامات الأشعة المقطعية وعلم الأنسجة على Hugging Face وModel Garden.
جوجل تقدم MedASR لتعزيز التعرف على الكلام الطبي وسير العمل السريري بالذكاء الاصطناعي
بالإضافة إلى ذلك، أطلقت جوجل MedASR، وهو نموذج مفتوح للتعرف التلقائي على الكلام مخصص للتفريغ الطبي، والذي يحول الكلام إلى نص ويتوافق مع MedGemma لمهام التفكير المتقدم
بينما يظل النص الواجهة السائدة لنماذج اللغة الكبيرة، يظل التواصل المنطوق يلعب دورًا مركزيًا في الممارسة السريرية، من تفريغ الأطباء إلى الاستشارات الفورية للمرضى، مما يجعل التعرف الدقيق على الكلام قدرة أساسية.
تم تصميم MedASR خصيصًا للغة الطبية، مما يتيح نسخًا أكثر موثوقية للمصطلحات الخاصة بالمجال ويعمل كوسيلة إدخال طبيعية لـ MedGemma. في اختبارات مقارنة ضد نموذج Whisper large-v3 العام، أظهر MedASR دقة أعلى بشكل ملحوظ، مع تقليل كبير في أخطاء النسخ على كل من تفريغات الأشعة على الصدر ومعيار داخلي واسع يغطي تخصصات طبية متعددة وأنماط متحدثين.
جميع نماذج HAI-DEF، بما في ذلك MedGemma 1.5، وMedASR، وMedSigLIP، مشفرة الصور، تظل مجانية للاستخدام البحثي والتجاري ويمكن الوصول إليها على Hugging Face أو دمجها في تطبيقات قابلة للتوسع على Vertex AI.
MedGemma يكتسب زخمًا عالميًا مع توسع أنظمة الرعاية الصحية والباحثين في اعتماد الذكاء الاصطناعي
وفقًا لجوجل، يتوسع اعتماد MedGemma بين شركات التكنولوجيا الصحية وفرق البحث حول العالم، مع استخدام النموذج بشكل متزايد لتسريع التطوير عبر مجموعة واسعة من التطبيقات الطبية
في ماليزيا، قامت Qmed Asia بدمج MedGemma في askCPG، وهو نظام حواري مصمم لتوفير الوصول إلى أكثر من 150 دليل إرشادي سريري وطني. وفقًا لوزارة الصحة الماليزية، حسّن الواجهة من قابلية استخدام هذه الأدلة في اتخاذ القرارات السريرية الروتينية، وأبلغت برامج تجريبية مبكرة عن ردود فعل قوية بشكل خاص على ميزات التصوير الطبي متعدد الوسائط المدعومة بواسطة MedGemma.
في تايوان، استخدمت إدارة التأمين الصحي الوطني MedGemma لتحليل التقييمات قبل العملية لجراحة سرطان الرئة. من خلال استخراج رؤى منظمة من عشرات الآلاف من تقارير علم الأنسجة وبيانات سريرية غير منظمة أخرى، يدعم المبادرة التحليل الإحصائي على نطاق واسع بهدف إبلاغ القرارات السياسية وتحسين تخطيط العمليات الجراحية ونتائج المرضى.
منذ إصدارها في وقت سابق من هذا العام، تم الإشارة إلى MedGemma على نطاق واسع في أبحاث الذكاء الاصطناعي الطبية الأكاديمية، حيث أظهرت أداء قوي كنموذج أساسي لمهام مثل فهم النصوص الطبية، ودعم القرارات السريرية متعددة التخصصات، وتقارير التصوير الشعاعي للثدي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
من المسح الضوئي إلى الكلام: كيف تعيد جوجل تعريف الذكاء الاصطناعي في الرعاية الصحية
ملخص سريع
قامت شركة جوجل بتحديث ذكائها الاصطناعي المفتوح المصدر MedGemma مع قدرات لتفسير الصور مثل الأشعة المقطعية والرنين المغناطيسي، وأطلقت أيضًا أداة MedASR مفتوحة المصدر لتحويل الكلام إلى نص.
أعلنت شركة التكنولوجيا جوجل عن تحديث لنموذج الذكاء الاصطناعي MedGemma، معززًا الدعم لتطبيقات التصوير الطبي
يدمج نموذج MedGemma 1.5 4B الجديد ملاحظات من مجتمع المطورين لتحسين دعم العديد من أنواع التصوير الطبي، بما في ذلك الصور عالية الأبعاد مثل الأشعة المقطعية والرنين المغناطيسي، وصور علم الأنسجة، والتصوير الطولي مثل سلسلة صور الأشعة على الصدر، ومهام تحديد الموقع التشريحي
كما يحسن فهم المستندات الطبية، مما يتيح استخراج البيانات المنظمة من تقارير المختبرات. مقارنةً بالإصدار السابق MedGemma 1 4B، يوفر تحديث 1.5 4B دقة محسنة للنص، والسجلات الطبية، والصور ثنائية الأبعاد، مع بقائه مضغوطًا بما يكفي للعمل بدون اتصال بالإنترنت
بالنسبة للتطبيقات النصية الأكثر تعقيدًا، يمكن للمطورين الاستمرار في استخدام نموذج MedGemma الأكبر الذي يحتوي على 27 مليار معلمة. تتوفر التفاصيل الكاملة والمعايير في بطاقة نموذج MedGemma 1.5.
تم بناء MedGemma أصلاً كنظام متعدد الوسائط ليعكس بيئة البيانات المعقدة في الطب، مع دعم الإصدارات المبكرة لتفسير الصور الطبية ثنائية الأبعاد مثل الأشعة على الصدر، وصور الأمراض الجلدية، وفحوصات الشبكية، وعينات علم الأنسجة. توسع الإصدار الأخير، MedGemma 1.5، هذه القدرات لتشمل التصوير الطبي عالي الأبعاد، مع دمج بيانات الأشعة المقطعية والرنين المغناطيسي ثلاثية الأبعاد بالإضافة إلى علم الأنسجة كامل الشريحة. يمكن للمطورين الآن إنشاء تطبيقات تعالج شرائح أو أجزاء متعددة من الصور مع مطالبات مخصصة، مما يمكّن من حالات تشخيص وتحليل أكثر تقدمًا.
وفقًا للتقييمات الداخلية، يُظهر MedGemma 1.5 تحسينات ملحوظة في الأداء عبر عدة مجالات، بما في ذلك تصنيف نتائج الأشعة المقطعية والرنين المغناطيسي، وتحليل علم الأنسجة، وتحديد الموقع التشريحي في صور الأشعة على الصدر، ومراجعة الصور الطولية، واستخراج البيانات المنظمة من تقارير المختبرات. كما يُظهر النموذج مكاسب كبيرة في فهم النصوص الطبية وأسئلة وإجابات السجلات الصحية الإلكترونية، مما يعكس تقدمات أوسع في الأداء البصري واللغوي.
يبني هذا التوسع على أدوات جوجل السابقة لأساس الأشعة المقطعية ويمثل واحدًا من أول النماذج المفتوحة متعددة الوسائط المتاحة علنًا القادرة على التعامل مع البيانات الطبية عالية الأبعاد بجانب النصوص التقليدية والصور ثنائية الأبعاد. على الرغم من أن هذه الميزات لا تزال تتطور، تتوقع الشركة أن يحقق المطورون تحسينات إضافية من خلال التخصيص في المجال، مدعومًا بدروس وموارد جديدة لإستخدامات الأشعة المقطعية وعلم الأنسجة على Hugging Face وModel Garden.
جوجل تقدم MedASR لتعزيز التعرف على الكلام الطبي وسير العمل السريري بالذكاء الاصطناعي
بالإضافة إلى ذلك، أطلقت جوجل MedASR، وهو نموذج مفتوح للتعرف التلقائي على الكلام مخصص للتفريغ الطبي، والذي يحول الكلام إلى نص ويتوافق مع MedGemma لمهام التفكير المتقدم
بينما يظل النص الواجهة السائدة لنماذج اللغة الكبيرة، يظل التواصل المنطوق يلعب دورًا مركزيًا في الممارسة السريرية، من تفريغ الأطباء إلى الاستشارات الفورية للمرضى، مما يجعل التعرف الدقيق على الكلام قدرة أساسية.
تم تصميم MedASR خصيصًا للغة الطبية، مما يتيح نسخًا أكثر موثوقية للمصطلحات الخاصة بالمجال ويعمل كوسيلة إدخال طبيعية لـ MedGemma. في اختبارات مقارنة ضد نموذج Whisper large-v3 العام، أظهر MedASR دقة أعلى بشكل ملحوظ، مع تقليل كبير في أخطاء النسخ على كل من تفريغات الأشعة على الصدر ومعيار داخلي واسع يغطي تخصصات طبية متعددة وأنماط متحدثين.
جميع نماذج HAI-DEF، بما في ذلك MedGemma 1.5، وMedASR، وMedSigLIP، مشفرة الصور، تظل مجانية للاستخدام البحثي والتجاري ويمكن الوصول إليها على Hugging Face أو دمجها في تطبيقات قابلة للتوسع على Vertex AI.
MedGemma يكتسب زخمًا عالميًا مع توسع أنظمة الرعاية الصحية والباحثين في اعتماد الذكاء الاصطناعي
وفقًا لجوجل، يتوسع اعتماد MedGemma بين شركات التكنولوجيا الصحية وفرق البحث حول العالم، مع استخدام النموذج بشكل متزايد لتسريع التطوير عبر مجموعة واسعة من التطبيقات الطبية
في ماليزيا، قامت Qmed Asia بدمج MedGemma في askCPG، وهو نظام حواري مصمم لتوفير الوصول إلى أكثر من 150 دليل إرشادي سريري وطني. وفقًا لوزارة الصحة الماليزية، حسّن الواجهة من قابلية استخدام هذه الأدلة في اتخاذ القرارات السريرية الروتينية، وأبلغت برامج تجريبية مبكرة عن ردود فعل قوية بشكل خاص على ميزات التصوير الطبي متعدد الوسائط المدعومة بواسطة MedGemma.
في تايوان، استخدمت إدارة التأمين الصحي الوطني MedGemma لتحليل التقييمات قبل العملية لجراحة سرطان الرئة. من خلال استخراج رؤى منظمة من عشرات الآلاف من تقارير علم الأنسجة وبيانات سريرية غير منظمة أخرى، يدعم المبادرة التحليل الإحصائي على نطاق واسع بهدف إبلاغ القرارات السياسية وتحسين تخطيط العمليات الجراحية ونتائج المرضى.
منذ إصدارها في وقت سابق من هذا العام، تم الإشارة إلى MedGemma على نطاق واسع في أبحاث الذكاء الاصطناعي الطبية الأكاديمية، حيث أظهرت أداء قوي كنموذج أساسي لمهام مثل فهم النصوص الطبية، ودعم القرارات السريرية متعددة التخصصات، وتقارير التصوير الشعاعي للثدي.