مشکل جستجو و محتوای کم ارزش وب ۲
چند روز پیش در خبرها خواندم که همسر اوان ویلیامز (از موسسان توییتر) حتی موقع زایمان هم دست از توییت کردن برنداشته و لحظه به لحظه اخبار را توییت میکرده است.

صرفنظر از اینکه توییت کردن موقع زایمان (که سلامتی مادر و فرزند مهمتر از همه چیز است) تا چه اندازه لازم است، یک بار دیگر به نقشی که سرویسهای وب ۲ در تولید محتوای کم ارزش و مشکلی که در جستجوی عمقی وب ایجاد میکنند فکر کردم.
ما امروز چطور جستجو میکنیم؟
به گوگل یا یک موتور جستجو دیگر میرویم، یک باکس جستجو، چند کلمه کلیدی وارد میکنیم (گاهی وقتها به همراه چند عملگر جستجو)، در صفحه اول جستجو چیزی را که میخواهیم پیدا میکنیم یا نه، به هر حال جستجوی ما محصور به ارزیابی خودمان از محتوای چند کلمهای است به صورت لینکهای آبی زیرخط دار در صفحه نتایج جستجو میبینیم.
روش کار؟ گوگل و موتور جستجوهای دیگر عملاً چیزی را در بیرون جستجو نمیکنند. آنها یک کپی از اطلاعات را در دیتابیس خود ذخیره میکنند و بعد به کمک الگوریتمهای خاص خودشان در آن جستجو میکنند. برای همین است که همیشه میتوانید در کش گوگل صفحات و وب سایتهایی پیدا کنید که دیگر وجود خارجی ندارند.
وب ۲: مشارکت کاربران در تولید محتوا
پیش از اینکه واقعاً سرویسهای وب ۲ از مشارکت کاربران و share کردن اطلاعات بهره ببرند، وبلاگها و وبلاگنویسان باعث گسترش محتوای آنلاین شدند.
با به وجود آمدن امکان مشارکت کاربران در تولید محتوا، از روشهایی مثل برچسبزنی و ارزشیابی (به کمک رای در سیستمهایی نظیر دیگ و بالاترین) برای پیدا کردن و نشانهگذاری محتوای مفید استفاده شد. اما این روش نیز به تدریج کارآیی خود را از دست میدهد. حجم اطلاعات به شدت در حال افزایش است و استفاده از روشهای بازنشری تنها به کپی شدن (شامل کپی شدن خود اطلاعات یا نسخه تغییر یافته یا لینک اطلاعات) بیشتر و بیهوده منتهی میشود. این نسخههای کپی شده از اطلاعات روی وب تنها جستجوی عمقی در وب را مشکلتر میکند. نه موتور جستجوهای سنتی (با روش خزیدن و ایندکس کردن اطلاعات) و نه روشهای جدید (تگ گذاری و نشانهدار کردن اطلاعات مفید) جوابگوی این حجم از اطلاعات نخواهند بود.
یک مثال: Twitter و محتوای بی ارزش
Twitter یک رسانه است. یک رسانه جدید برای رساندن صدای مردم. اما نزدیک نیمی از توییتهای مردم بیاهمیت و بیارزش هستند. در چنین شرایطی فکر میکنید پیدا کردن صدای واقعی مردم در میان انبوه توییتهای بیارزش و اسپم چقدر مشکل است؟ به موضوعات داغی که عموماً با تگ گذاری توییتها (با استفاده از #) در سطح توییتر ایجاد میشوند دقت کنید، بعد از چند ساعت خیلی از توییتهای کاملاً بیربط با موضوع اما با تگ یک موضوع داغ را میتوانید ببینید.
حالا اگر به دنبال چیزی باشید با این حجم از اطلاعات بیارزش و اسپم فکر میکنید شانس موفقیت چقدر است؟ این مشکل تنها در مورد متن نیست، امروز ما عکس و ویدئو و صدا را هم با روش سنتی (جستجوی کلمات کلیدی یا برچسب و عنوان و …) پیدا میکنیم.
جستجوی آینده
در آینده جستجو بر اساس درک ماشین از معنا و مفهوم اطلاعات شکل میگیرد: وب معنایی.
نرمافزارهای امروز درکی از معنای اطلاعات ندارند، آنها تنها در یک بانک اطلاعاتی که به اطلاعات به شکل یک رشته نگاه میکند به دنبال کلمات کلیدی که کاربر وارد کرده میگردند، اما اگر نرمافزارها بتوانند معنای اطلاعات را بفهمند، جستجو در میان اطلاعات سادهتر، دقیقتر و کاراتر میشود. این چیزی است که میخواهم دربارهاش بیشتر صحبت کنم: وب معنایی
این آینده در واقع خیلی هم از ما دور نیست، بخشی از زیرساخت مورد نیاز همین حالا هم فراهم است.
ادامه دارد…
این مورد وب معنایی جالبه. دوست دارم بیشتر راجع بهش بدونم.