خانه > وب > مشکل جستجو و محتوای کم ارزش وب ۲

مشکل جستجو و محتوای کم ارزش وب ۲

چند روز پیش در خبرها خواندم که همسر اوان ویلیامز (از موسسان توییتر) حتی موقع زایمان هم دست از توییت کردن برنداشته و لحظه به لحظه اخبار را توییت می‌کرده است.

یکی از توییتهای سارا در بیمارستان

صرفنظر از اینکه توییت کردن موقع زایمان (که سلامتی مادر و فرزند مهمتر از همه چیز است) تا چه اندازه لازم است، یک بار دیگر به نقشی که سرویس‌های وب ۲ در تولید محتوای کم ارزش و مشکلی که در جستجوی عمقی وب ایجاد می‌کنند فکر کردم.

ما امروز چطور جستجو می‌کنیم؟
به گوگل یا یک موتور جستجو دیگر می‌رویم، یک باکس جستجو، چند کلمه کلیدی وارد می‌کنیم (گاهی وقت‌ها به همراه چند عملگر جستجو)، در صفحه اول جستجو چیزی را که می‌خواهیم پیدا می‌کنیم یا نه، به هر حال جستجوی ما محصور به ارزیابی خودمان از محتوای چند کلمه‌ای است به صورت لینک‌های آبی زیرخط دار در صفحه نتایج جستجو می‌بینیم.

روش کار؟ گوگل و موتور جستجوهای دیگر عملاً چیزی را در بیرون جستجو نمی‌کنند. آن‌ها یک کپی از اطلاعات را در دیتابیس خود ذخیره می‌کنند و بعد به کمک الگوریتم‌های خاص خودشان در آن جستجو می‌کنند. برای همین است که همیشه می‌توانید در کش گوگل صفحات و وب سایت‌هایی پیدا کنید که دیگر وجود خارجی ندارند.

وب ۲: مشارکت کاربران در تولید محتوا
پیش از اینکه واقعاً سرویس‌های وب ۲ از مشارکت کاربران و share کردن اطلاعات بهره ببرند، وبلاگ‌‌ها و وبلاگ‌نویسان باعث گسترش محتوای آنلاین شدند.
با به وجود آمدن امکان مشارکت کاربران در تولید محتوا، از روش‌هایی مثل برچسب‌زنی و ارزشیابی (به کمک رای در سیستم‌هایی نظیر دیگ و بالاترین) برای پیدا کردن و نشانه‌گذاری محتوای مفید استفاده شد. اما این روش نیز به تدریج کارآیی خود را از دست می‌دهد. حجم اطلاعات به شدت در حال افزایش است و استفاده از روش‌های بازنشری تنها به کپی شدن (شامل کپی شدن خود اطلاعات یا نسخه تغییر یافته یا لینک اطلاعات) بیشتر و بیهوده منتهی می‌شود. این نسخه‌های کپی شده از اطلاعات روی وب تنها جستجوی عمقی در وب را مشکل‌تر می‌کند. نه موتور جستجوهای سنتی (با روش خزیدن و ایندکس کردن اطلاعات) و نه روش‌های جدید (تگ گذاری و نشانه‌دار کردن اطلاعات مفید) جوابگوی این حجم از اطلاعات نخواهند بود.

یک مثال: Twitter و محتوای بی ارزش
Twitter یک رسانه است. یک رسانه جدید برای رساندن صدای مردم. اما نزدیک نیمی از توییت‌های مردم بی‌اهمیت و بی‌ارزش هستند. در چنین شرایطی فکر می‌کنید پیدا کردن صدای واقعی مردم در میان انبوه توییت‌های بی‌ارزش و اسپم چقدر مشکل است؟ به موضوعات داغی که عموماً با تگ گذاری توییت‌ها (با استفاده از #) در سطح توییتر ایجاد می‌شوند دقت کنید، بعد از چند ساعت خیلی از توییت‌های کاملاً بی‌ربط با موضوع اما با تگ یک موضوع داغ را می‌توانید ببینید.
حالا اگر به دنبال چیزی باشید با این حجم از اطلاعات بی‌ارزش و اسپم فکر می‌کنید شانس موفقیت‌ چقدر است؟ این مشکل تنها در مورد متن نیست، امروز ما عکس و ویدئو و صدا را هم با روش‌ سنتی (جستجوی کلمات کلیدی یا برچسب و عنوان و …) پیدا می‌کنیم.

جستجوی آینده 
در آینده جستجو بر اساس درک ماشین از معنا و مفهوم اطلاعات شکل می‌گیرد: وب معنایی.
نرم‌افزارهای امروز درکی از معنای اطلاعات ندارند، آن‌ها تنها در یک بانک اطلاعاتی که به اطلاعات به شکل یک رشته نگاه می‌کند به دنبال کلمات کلیدی که کاربر وارد کرده می‌گردند، اما اگر نرم‌افزارها بتوانند معنای اطلاعات را بفهمند، جستجو در میان اطلاعات ساده‌تر، دقیق‌تر و کاراتر می‌شود. این چیزی است که می‌خواهم درباره‌اش بیشتر صحبت کنم: وب معنایی
این آینده در واقع خیلی هم از ما دور نیست، بخشی از زیرساخت مورد نیاز همین حالا هم فراهم است.

ادامه دارد…

  1. ۲۷ مرداد ۱۳۸۸ در ۱۶:۴۲ | #1

    این مورد وب معنایی جالبه. دوست دارم بیشتر راجع بهش بدونم.

  1. بدون بازتاب