اختتامیه رویداد لیبتک ۲: چالش تشخیص موضوع و نتایج رویداد

نویسنده: تیم تحریریه ایران‌سرور
دسته بندی: اخبار, رایانش ابری ☁

انتشار: 1400/03/09
به‌روز‌رسانی:۱۴۰۰/۰۳/۰۹
زمان مطالعه:6 دقیقه
0 نظر | | 0/5

دومین رویداد لیبتک، توسط سازمان اسناد و کتابخانه ملی ایران و با حمایت هلدینگ دانش‌بنیان گرین‌ وب اجرا شد برگزار شد.

لیبتک چیست؟

ین عبارت از ترکیب دو کلمه Library به‌معنای کتابخانه و Technology به‌معنای فناوری به وجود آمده است.

این رویداد که «چالش تشخیص موضوع» نام داشت، با هدف به‌کارگیری فناوری‌های نوین و هوش مصنوعی در تحلیل متون کتابخانه‌ای و آرشیوی، برگزار شد.

طی این رویداد، کسب‌و‌کارهای نوپا در محیطی دانش محور به رقابت پرداختند و علوم و مهارت‌های خود را، به‌صورت عملی در راستای حل مسائل کشور به کار گرفتند.

منظور از چالش تشخیص موضوع چیست؟

تا الان عنوان‌های اختصاص داده‌شده به منابع کتابخانه ملی به صورت دستی، در قالب برچسب‌گذاری، توسط کارشناسان حوزه فهرست‌نویسی انجام میشد، که باتوجه به روحیات، تخصص و تجربه افراد، این فرآیند دچار خطاهای احتمالی بسیاری بود.
کتابخانه ملی با همکاری مرکز نوآوری و با هدف استفاده حداکثری از ظرفیت متخصصان هوش مصنوعی، در راستای خودکارسازی روند برچسب‌گذاری موضوعی منابع، رویداد لیبتک را برگزار کرد.

نقش ابر ایران‌سرور در رویداد لیبتک

شرکت‌کنندگان برای کدنویسی و ساختن مدل خود به یک GPU با قدرت بسیار بالا احتیاج داشتند. در این مرحله ابر ایران‌سرور به عنوان حامی اصلی رویداد لیبتک وارد صحنه شد و سرویس GPU ابری خود را، به صورت ۶ نوبت پنج ساعته، در اختیار تیم‌های شرکت‌کننده گذاشت با بتوانند مدل خود را در آن اجرا کنند.

تیم‌های شرکت‌کننده در رویداد

پس از دعوت از دانشجویان، تیم‌ها و شرکت‌های فعال در حوزه هوش مصنوعی برای مشارکت در این رویداد، ۳۶ تیم ثبت‌‌نام کردند و مهلت ۵۰ روزه برای ساخت مدل برای تشخیص هوشمند موضوعات، از Data set که توسط کتابخانه ملی آماده شده بود، تعیین شد. در پایان، بهترین تیم با کم‌خطاترین مدل، ۵۰۰ میلیون ریال دریافت می‌کرد.

شرکت‌کنندگان می‌توانستند مدل خود را در سرویس GPU ابری ایران سرور اجرا و آن را تست کنند.

در مرحله بعد شرکنندگان مدل خود را روی Test Data ارزیابی کرده و نتایج را برای گروه داوری ارسال کردند. پس از مقایسه نتایج با کلید موضوعات Test Data و سنجش دقت مدل‌ها، ۵ تیم برتر انتخاب شدند.
در روز اختتامیه این ۵ تیم در حضور داوران، از متخصصان حوزه هوش مصنوعی و پردازش زبان طبیعی بودند، مدل خود را ارائه دادند.
پس از چالش‌های فراوان و انتخاب یک تیم برای کسب مقام نخست، قراردادی مابین تیم‌های اول و دوم این مسابقه و کتابخانه ملی، در راستای هوشمندسازی فرآیند برچسب‌گذاری موضوعی منابع، بسته شد.

اختتامیه رویداد لیبتک

در نهایت از بین ۳۶ شرکت کننده، چهار نفر به مرحله پایانی راه پیدا کردند. از بین این چهار شرکت‌کننده، دو نفر از GPU ارائه‌شده توسط ابرایران‌سرور (2080Ti) برای پردازش و همان تشخیص موضوع – که چالش این دوره بود – استفاده کردند. محمد کراهی و محمد صدر.

محمد کراهی، متخصص هوش مصنوعی فارغ‌التحصیل از دانشگاه فردوسی مشهد است. آقای کراهی به‌عنوان نماینده شرکت دادماتک که در زمینه NLP فعالیت می‌کند، در لیبتک دوم حضور داشتند.

محمد صدر هم عضو شرکت Iran Gpu است که توانست جزو ۴ نفر برتر این مسابقه قرار بگیرد.

مراسم اختتامیه لیبتک، بهانه خوبی بود تا گپی با این دو شرکت‌کننده داشته باشیم.

آقای کراهی کیفیت سرویس GPU ابرایران‌سرور و توانایی‌های این محصول را چگونه ارزیابی می‌کند؟

سیستم از نظر کیفیت و کارایی در سطح بالایی قرار داشت. آن‌قدر که حتی انتظار هم نمیرفت. تنها مشکلی که وجود داشت، پیچیده‌ بودن طرح و کمبود زمان مسابقه لیبتک بود که اجازه نداد GPU تمام کارها را انجام دهد. اما در کل، با توجه به اینکه این حوزه در کشور ما تازه‌وارد است، حتی در مقایسه با انواع خارجی هم نمره قابل‌قبولی کسب می‌کند.

به نظر شما GPU ابرایران‌سرور چه اندازه می‌تواند با رقبا خارجی خود رقابت کند؟

2080Ti حتی می‌تواند با رقبای خارجی مثل گوگل کالب هم رقابت کند! قیمت بسیار کم‌تر این مدل، اختلاف ناچیز فنی را به‌خوبی پوشش می‌دهد. البته که همچنان جای توسعه در سخت‌افزار و نرم‌افزار وجود دارد.

این مسئله برای استفاده‌کنندگان داخل کشور مزیت بسیار بزرگی است.

آقای صدر بدون تعارف چنین رویدادهایی واقعاً چقدر موثر هستند؟

چنین رویدادهایی می‌توانند مفید باشند، به یک شرط خیلی مهم! آن هم اینکه به خروجی‌ها پس از پایان رویداد هم توجه شود. نه اینکه صرفاً مسابقه‌ای برگزار شود و به برنده جایزه بدهند و تمام! باید دید آینده‌نگرانه‌تری نسبت به این رویدادها وجود داشته باشد.

مثلاً کتابخانه ملی باید به برندگان این رویداد و سرویس‌های جدید، به چشم ابزارهای کاربردی نگاه کند. ابزارهایی که می‌توانند فرایندها را خودکارسازی کنند. نه اینکه همچنان مثل گذشته از نیروهای کار فیزیکی (مشخصاً انسان) برای چنین کارهایی استفاده شود.

مسئله به‌اشتراک گذاشتن داده‌ها را هم نباید فراموش کرد. مشکلی که از اوایل برگذاری همین لیبتک هم وجود داشت. دیتاهای لازم با کلی ماجرا و دردسر در اختیار دیگران گذاشته شد. به همین خاطر به فاز Pre Proccessing آسیب زیادی وارد شد. فازی که اهمیت زیادی در خروجی نهایی کار دارد.

با همین دید آینده‌نگرانه است که می‌توان امیدوار بود لیبتک ۳ بهتر از لیبتک ۲ باشد. لیبتک ۴ بهتر از لیبتک ۳ باشد.

تفاوت موجود بین کمپانی عظیمی مثل گوگل و توانایی‌های کشورمان در موضوعی مثل دیجیتال کردن کتاب‌های موجود، تا چه اندازه است؟

اگر گوگل را ۱۰۰ درنظر بگیریم، ایران نهایتاً ۲۰ یا دست پر ۳۰ است!

ممنون می‌شویم کمی بیشتر راجب به شرکت‌ خود، یعنی Iran Gpu برایمان بگویید.

ما یک پلتفرم همه‌فن حریف را همراه با کارت گرافیک‌های 2080Ti در اختیار افراد قرار می‌دهیم. کسانی که در حوزه هوش مصنوعی کار می‌کنند یا هر کار دیگری که نیاز به پردازش‌های گوناگون داشته باشد. حتی پردازش صوت و تصویر!

بزرگ‌ترین احساس نیازی که ما در این زمینه داشتیم و منجر به تولد Iran GPU شد، سرعت بود. به همین خاطر سرعت بالا یکی از مهم‌ترین خصوصیات سرویس ما است.

در حال حاضر هم در تلاشیم تا با خودکارسازی فرایندهای مختلف، کار تهیه این سرویس را برای کاربران تا حد ممکن آسان کنیم.

مسیر رو‌به‌رشدی را شروع کرده‌ایم و هرروز بهتر از روز قبل می‌شویم. البته که قطعاً هنوز نواقصی وجود دارد که با تلاش و تخصص همکارانم آن‌ها هم برطرف می‌شوند.