بهنظر میرسد که دادههای موجود در اینترنت برای توسعهی مدلهای هوش مصنوعی کافی نیستند.
شرکتهای هوش مصنوعی هرچقدر که به ساخت مدلهای بزرگتر و بهتر ادامه میدهند، بیشتر با مشکلی خاص مواجه میشوند: اینترنت بهاندازهی کافی بزرگ نیست تا همهی دادههای لازم را فراهم کند.
دادهها نقش محوری در توسعهی هوش مصنوعی ایفا میکنند. هرچه دادههای بیشتری برای آموزش مدل هوش مصنوعی استفاده شود، آن سیستم هوشمندتر میشود. درمقابل، بهنظر میرسد که دادههای طبیعی (تولیدشدهی انسان) منابع محدودی هستند و ممکن است روزی تمام شوند.
-
زانوبند طبی طب پوش مدل ۱۶۱
۱,۲۰۰,۰۰۰ ﷼ خرید محصول -
لپ تاپ ۱۵.۶ اینچی ایسوس مدل FX506 HE – HN029
خرید محصول -
باتری گوشی ال جی مدل 330G مناسب برای گوشی ال جی KF300
خرید محصول -
برچسب بدنه خودرو مهدیار طرح پنجه مانستر کدSB111T
اطلاعات بیشتر -
دستبند طلا ۱۸ عیار مردانه لیردا مدل نت موسیقی کد 180D 7001
۷۲۵,۰۰۰ ﷼ انتخاب گزینهها این محصول دارای انواع مختلفی می باشد. گزینه ها ممکن است در صفحه محصول انتخاب شوند -
ال ای دی آکواریوم سوبو مدل a3
۱۴۹,۰۰۰ ﷼ انتخاب گزینهها این محصول دارای انواع مختلفی می باشد. گزینه ها ممکن است در صفحه محصول انتخاب شوند -
لپ تاپ ۱۵ اینچی اچ پی مدل Pavilion 15-bc299nia
خرید محصول -
سویشرت نوزادی لونی تونز مدل 592as
خرید محصول
مؤسسهی آیندهپژوهی Epoch AI پیشبینی کرده است که شرکتهای هوش مصنوعی احتمالاً تا سال ۲۰۲۶ با کمبود دادههای آموزشی متنی باکیفیت مواجه خواهند شد.
بهگزارش روزنامهی وال استریت ژورنال، ازآنجاکه رشد محتواهای موجود در اینترنت سریع نیست، برخی از شرکتها در حال جستوجوی منابع جایگزین برای آموزش مدلها هستند و به گزینههایی مانند زیرنویس ویدئوها یا حتی اطلاعات ساختهشده با هوش مصنوعی مولد فکر میکنند.
گفته میشود که OpenAI مدل GPT-5 را بهکمک زیرنویس ویدئوهای عمومی یوتیوب توسعه داده است. مدتی پیش میرا موراتی، مدیر ارشد فناوری OpenAI، از پاسخ به این پرسش که «آیا از محتواهای یوتیوب برای آموزش مدل هوش مصنوعی سورا (Sora) استفاده شده است؟»، خودداری کرد.
بهکارگیری دادههای ساختگی برای تعلیم مدلهای هوش مصنوعی موضوع بحث فراوانی در ماههای اخیر بوده است و بعضی از پژوهشگران دریافتهاند که آموزش مدل هوش مصنوعی مبتنیبر دادههایی که قبلاً هوش مصنوعی دیگر تولید کردهاند، میتواند به فروپاشی مدل یا خلق نتایج معیوب منجر شود.
بعضی از شرکتها مانند OpenAI و Anthropic، خالق مدل هوش مصنوعی Claude، بهدنبال تولید محتواهای ساختگی باکیفیتتری هستند تا از شکلگیری مدلی جلوگیری کنند که با دادههای بیارزش آموزش دیده باشد. بااینحال، هیچکدام از آنها جزئیات دقیق پروژههایشان را فاش نکردهاند.
آنتروپیک هنگام رونمایی Claude 3 گفت که این مدل براساس دادههایی که خودشان تولید کردهاند، آموزش دیده است. جرد کاپلان، دانشمند ارشد آنتروپیک، نیز در مصاحبه با وال استریت ژورنال اعلام کرد که معتقد است برای دادههای ساختگی نیز کاربردهای زیادی وجود دارد.
مجلهی هاروارد بیزینس ریویو مینویسد: «در پنج سال آینده، اپلیکیشنها و دستگاهها کمتر مصنوعی و بیشتر هوشمند خواهند شد. آنها کمتر به یادگیری از کلاندادهها و بیشتر به استدلال از کل به جزء وابسته خواهند بود که شبیه روش انسانها در حل مسائل و انجام وظایف است. قدرت استدلال میتواند کاربردهای گستردهتری برای هوش مصنوعی فراهم کند.»