دومین رویداد لیبتک، توسط سازمان اسناد و کتابخانه ملی ایران و با حمایت هلدینگ دانشبنیان گرین وب اجرا شد برگزار شد.
لیبتک چیست؟
ین عبارت از ترکیب دو کلمه Library بهمعنای کتابخانه و Technology بهمعنای فناوری به وجود آمده است.
این رویداد که «چالش تشخیص موضوع» نام داشت، با هدف بهکارگیری فناوریهای نوین و هوش مصنوعی در تحلیل متون کتابخانهای و آرشیوی، برگزار شد.
طی این رویداد، کسبوکارهای نوپا در محیطی دانش محور به رقابت پرداختند و علوم و مهارتهای خود را، بهصورت عملی در راستای حل مسائل کشور به کار گرفتند.
منظور از چالش تشخیص موضوع چیست؟
تا الان عنوانهای اختصاص دادهشده به منابع کتابخانه ملی به صورت دستی، در قالب برچسبگذاری، توسط کارشناسان حوزه فهرستنویسی انجام میشد، که باتوجه به روحیات، تخصص و تجربه افراد، این فرآیند دچار خطاهای احتمالی بسیاری بود.
کتابخانه ملی با همکاری مرکز نوآوری و با هدف استفاده حداکثری از ظرفیت متخصصان هوش مصنوعی، در راستای خودکارسازی روند برچسبگذاری موضوعی منابع، رویداد لیبتک را برگزار کرد.
نقش ابر ایرانسرور در رویداد لیبتک
شرکتکنندگان برای کدنویسی و ساختن مدل خود به یک GPU با قدرت بسیار بالا احتیاج داشتند. در این مرحله ابر ایرانسرور به عنوان حامی اصلی رویداد لیبتک وارد صحنه شد و سرویس GPU ابری خود را، به صورت 6 نوبت پنج ساعته، در اختیار تیمهای شرکتکننده گذاشت با بتوانند مدل خود را در آن اجرا کنند.
تیمهای شرکتکننده در رویداد
پس از دعوت از دانشجویان، تیمها و شرکتهای فعال در حوزه هوش مصنوعی برای مشارکت در این رویداد، 36 تیم ثبتنام کردند و مهلت 50 روزه برای ساخت مدل برای تشخیص هوشمند موضوعات، از Data set که توسط کتابخانه ملی آماده شده بود، تعیین شد. در پایان، بهترین تیم با کمخطاترین مدل، 500 میلیون ریال دریافت میکرد.
شرکتکنندگان میتوانستند مدل خود را در سرویس GPU ابری ایران سرور اجرا و آن را تست کنند.
در مرحله بعد شرکنندگان مدل خود را روی Test Data ارزیابی کرده و نتایج را برای گروه داوری ارسال کردند. پس از مقایسه نتایج با کلید موضوعات Test Data و سنجش دقت مدلها، 5 تیم برتر انتخاب شدند.
در روز اختتامیه این 5 تیم در حضور داوران، از متخصصان حوزه هوش مصنوعی و پردازش زبان طبیعی بودند، مدل خود را ارائه دادند.
پس از چالشهای فراوان و انتخاب یک تیم برای کسب مقام نخست، قراردادی مابین تیمهای اول و دوم این مسابقه و کتابخانه ملی، در راستای هوشمندسازی فرآیند برچسبگذاری موضوعی منابع، بسته شد.
اختتامیه رویداد لیبتک
در نهایت از بین 36 شرکت کننده، چهار نفر به مرحله پایانی راه پیدا کردند. از بین این چهار شرکتکننده، دو نفر از GPU ارائهشده توسط ابرایرانسرور (2080Ti) برای پردازش و همان تشخیص موضوع – که چالش این دوره بود – استفاده کردند. محمد کراهی و محمد صدر.
محمد کراهی، متخصص هوش مصنوعی فارغالتحصیل از دانشگاه فردوسی مشهد است. آقای کراهی بهعنوان نماینده شرکت دادماتک که در زمینه NLP فعالیت میکند، در لیبتک دوم حضور داشتند.
محمد صدر هم عضو شرکت Iran Gpu است که توانست جزو 4 نفر برتر این مسابقه قرار بگیرد.
مراسم اختتامیه لیبتک، بهانه خوبی بود تا گپی با این دو شرکتکننده داشته باشیم.
- آقای کراهی کیفیت سرویس GPU ابرایرانسرور و تواناییهای این محصول را چگونه ارزیابی میکند؟
سیستم از نظر کیفیت و کارایی در سطح بالایی قرار داشت. آنقدر که حتی انتظار هم نمیرفت. تنها مشکلی که وجود داشت، پیچیده بودن طرح و کمبود زمان مسابقه لیبتک بود که اجازه نداد GPU تمام کارها را انجام دهد. اما در کل، با توجه به اینکه این حوزه در کشور ما تازهوارد است، حتی در مقایسه با انواع خارجی هم نمره قابلقبولی کسب میکند.
- به نظر شما GPU ابرایرانسرور چه اندازه میتواند با رقبا خارجی خود رقابت کند؟
2080Ti حتی میتواند با رقبای خارجی مثل گوگل کالب هم رقابت کند! قیمت بسیار کمتر این مدل، اختلاف ناچیز فنی را بهخوبی پوشش میدهد. البته که همچنان جای توسعه در سختافزار و نرمافزار وجود دارد.
این مسئله برای استفادهکنندگان داخل کشور مزیت بسیار بزرگی است.
- آقای صدر بدون تعارف چنین رویدادهایی واقعاً چقدر موثر هستند؟
چنین رویدادهایی میتوانند مفید باشند، به یک شرط خیلی مهم! آن هم اینکه به خروجیها پس از پایان رویداد هم توجه شود. نه اینکه صرفاً مسابقهای برگزار شود و به برنده جایزه بدهند و تمام! باید دید آیندهنگرانهتری نسبت به این رویدادها وجود داشته باشد.
مثلاً کتابخانه ملی باید به برندگان این رویداد و سرویسهای جدید، به چشم ابزارهای کاربردی نگاه کند. ابزارهایی که میتوانند فرایندها را خودکارسازی کنند. نه اینکه همچنان مثل گذشته از نیروهای کار فیزیکی (مشخصاً انسان) برای چنین کارهایی استفاده شود.
مسئله بهاشتراک گذاشتن دادهها را هم نباید فراموش کرد. مشکلی که از اوایل برگذاری همین لیبتک هم وجود داشت. دیتاهای لازم با کلی ماجرا و دردسر در اختیار دیگران گذاشته شد. به همین خاطر به فاز Pre Proccessing آسیب زیادی وارد شد. فازی که اهمیت زیادی در خروجی نهایی کار دارد.
با همین دید آیندهنگرانه است که میتوان امیدوار بود لیبتک 3 بهتر از لیبتک 2 باشد. لیبتک 4 بهتر از لیبتک 3 باشد.
- تفاوت موجود بین کمپانی عظیمی مثل گوگل و تواناییهای کشورمان در موضوعی مثل دیجیتال کردن کتابهای موجود، تا چه اندازه است؟
اگر گوگل را 100 درنظر بگیریم، ایران نهایتاً 20 یا دست پر 30 است!
- ممنون میشویم کمی بیشتر راجب به شرکت خود، یعنی Iran Gpu برایمان بگویید.
ما یک پلتفرم همهفن حریف را همراه با کارت گرافیکهای 2080Ti در اختیار افراد قرار میدهیم. کسانی که در حوزه هوش مصنوعی کار میکنند یا هر کار دیگری که نیاز به پردازشهای گوناگون داشته باشد. حتی پردازش صوت و تصویر!
بزرگترین احساس نیازی که ما در این زمینه داشتیم و منجر به تولد Iran GPU شد، سرعت بود. به همین خاطر سرعت بالا یکی از مهمترین خصوصیات سرویس ما است.
در حال حاضر هم در تلاشیم تا با خودکارسازی فرایندهای مختلف، کار تهیه این سرویس را برای کاربران تا حد ممکن آسان کنیم.
مسیر روبهرشدی را شروع کردهایم و هرروز بهتر از روز قبل میشویم. البته که قطعاً هنوز نواقصی وجود دارد که با تلاش و تخصص همکارانم آنها هم برطرف میشوند.