چند نفری در گوگل ریدر هستند که در روز گاه چند صد مطلب Share میکنند. وحید آنلاین یکی از آنهاست.
من گاهی وقتها واقعاً به این فکر میکنم که یک ربات نرمافزاری کنترل این اکانتها را بر عهده دارد! بارها اتفاق افتاده که آیتمهای شیر شده را صفر کردهام و چند دقیقه بعد دوباره چند آیتم جدید خوانده نشده در شیرهای این دوستان دیدم!
تصور کنید اگر مطالعه و پیگیری آیتمهای شیرشده توسط این دوستان مشکل است، پیدا کردن و انتخاب مطالب از بین صدها منبع مختلف برای خود این دوستان چقدر میتواند مشکل باشد.
چند سال پیش وقتی هنوز استفاده از RSS به این گستردگی نبود و همه نرمافزارهای انتشار محتوا از این فرمتها استفاده نمیکردند، برای اطلاع از به روز بودن یک سایت یا وبلاگ میبایست واقعاً مجبور بودیم به آن سایت یا وبلاگ سر بزنیم، این کار بسیار زمان بر بود و به دلیل اینکه حداقل باید صفحه اول سایت لود میشد تا از به روز بودن یا نبودنش مطمئن شویم هزینه زیادی هم برای کاربران ایجاد میکرد. اینجا بود که RSS ضمن نجات دادن کاربران از این دردسر همیشگی به انتشار انفجاری اطلاعات در سطح وسیع هم کمک کرد.
حالا همین مساله برای فیدهای RSS به وجود آمده، تعداد فیدهایی که هر روز باید مطالبشان را ببینیم زیاد شدهاند، دنبال کردن این مطالب به خودی خود دشوار است چه برسد به اینکه بخواهیم مطالب Share شده توسط دوستان را هم دنبال کنیم آن هم روی سرویسها و سایتهای مختلف. آیا راه حلی برای این مساله وجود دارد؟ آیا میتوانیم نرمافزارهای داشته باشیم که مثل وحید آنلاین عمل کنند و مطالب مورد علاقه ما را از میان صدها و هزارها مطلب که در روز منتشر میشود برایمان جدا کنند؟ آیا میتوانیم یک خبرگزاری شخصی درست کنیم؟ در چند نوشته به پاسخ این سوالات خواهم پرداخت.
جستجوی ذخیره شده
در اولین گام از بررسی روشهای نرمافزاری به جستجوی ذخیره شده میپردازم. برای روشن شدن موضوع فرندفید را در نظر بگیرید. سایتی که کاربران میتوانند فید سرویسهای مختلف را به آن متصل کنند و در یک اینترفیس خوب (شاید بهترین در حوزه اینگونه سایتها) به صورت Realtime مطالب را ببینند و Share کنند و Like بزنند و در موردشان نظر بدهند. فرندفید بخشی دارد به عنوان جستجوی ذخیره شده، کاربران در این بخش میتوانند یک View سفارشی از اطلاعات روی فرندفید بر اساس پارامترهایی که خود تنظیم میکنند داشته باشند. مثلاً من میتوانم برای جدا کردن مطالب مهم آی تی، یک جستجو ذخیره شده درست کنم که در آن، فیدهایی از گروه آی تی (که خودم از مجموعه دوستانم در فرندفید ساختهام) را نشان بدهد که حداقل ۵ لایک و ۵ نظر داشته باشند، یا کاربر/کاربران خاصی در موردش نظر داده باشند یا شامل کلمه/کلمات خاصی در عنوان فید یا نظرات آن باشد. وقتی از این امکان استفاده میکنید به سادگی میتوانید View های سفارشی که به شما امکان غربالگری بهتر محتوا را میدهند داشته باشید.
در این مورد بیشتر صحبت میکنیم. شما هم در کامنتها میتوانید روشهایی را که برای دسترسی به محتوای مورد علاقهتان در اقیانوس محتوای روی وب استفاده میکنید معرفی کنید.
چند روز پیش در خبرها خواندم که همسر اوان ویلیامز (از موسسان توییتر) حتی موقع زایمان هم دست از توییت کردن برنداشته و لحظه به لحظه اخبار را توییت میکرده است.

صرفنظر از اینکه توییت کردن موقع زایمان (که سلامتی مادر و فرزند مهمتر از همه چیز است) تا چه اندازه لازم است، یک بار دیگر به نقشی که سرویسهای وب ۲ در تولید محتوای کم ارزش و مشکلی که در جستجوی عمقی وب ایجاد میکنند فکر کردم.
ما امروز چطور جستجو میکنیم؟
به گوگل یا یک موتور جستجو دیگر میرویم، یک باکس جستجو، چند کلمه کلیدی وارد میکنیم (گاهی وقتها به همراه چند عملگر جستجو)، در صفحه اول جستجو چیزی را که میخواهیم پیدا میکنیم یا نه، به هر حال جستجوی ما محصور به ارزیابی خودمان از محتوای چند کلمهای است به صورت لینکهای آبی زیرخط دار در صفحه نتایج جستجو میبینیم.
روش کار؟ گوگل و موتور جستجوهای دیگر عملاً چیزی را در بیرون جستجو نمیکنند. آنها یک کپی از اطلاعات را در دیتابیس خود ذخیره میکنند و بعد به کمک الگوریتمهای خاص خودشان در آن جستجو میکنند. برای همین است که همیشه میتوانید در کش گوگل صفحات و وب سایتهایی پیدا کنید که دیگر وجود خارجی ندارند.
وب ۲: مشارکت کاربران در تولید محتوا
پیش از اینکه واقعاً سرویسهای وب ۲ از مشارکت کاربران و share کردن اطلاعات بهره ببرند، وبلاگها و وبلاگنویسان باعث گسترش محتوای آنلاین شدند.
با به وجود آمدن امکان مشارکت کاربران در تولید محتوا، از روشهایی مثل برچسبزنی و ارزشیابی (به کمک رای در سیستمهایی نظیر دیگ و بالاترین) برای پیدا کردن و نشانهگذاری محتوای مفید استفاده شد. اما این روش نیز به تدریج کارآیی خود را از دست میدهد. حجم اطلاعات به شدت در حال افزایش است و استفاده از روشهای بازنشری تنها به کپی شدن (شامل کپی شدن خود اطلاعات یا نسخه تغییر یافته یا لینک اطلاعات) بیشتر و بیهوده منتهی میشود. این نسخههای کپی شده از اطلاعات روی وب تنها جستجوی عمقی در وب را مشکلتر میکند. نه موتور جستجوهای سنتی (با روش خزیدن و ایندکس کردن اطلاعات) و نه روشهای جدید (تگ گذاری و نشانهدار کردن اطلاعات مفید) جوابگوی این حجم از اطلاعات نخواهند بود.
یک مثال: Twitter و محتوای بی ارزش
Twitter یک رسانه است. یک رسانه جدید برای رساندن صدای مردم. اما نزدیک نیمی از توییتهای مردم بیاهمیت و بیارزش هستند. در چنین شرایطی فکر میکنید پیدا کردن صدای واقعی مردم در میان انبوه توییتهای بیارزش و اسپم چقدر مشکل است؟ به موضوعات داغی که عموماً با تگ گذاری توییتها (با استفاده از #) در سطح توییتر ایجاد میشوند دقت کنید، بعد از چند ساعت خیلی از توییتهای کاملاً بیربط با موضوع اما با تگ یک موضوع داغ را میتوانید ببینید.
حالا اگر به دنبال چیزی باشید با این حجم از اطلاعات بیارزش و اسپم فکر میکنید شانس موفقیت چقدر است؟ این مشکل تنها در مورد متن نیست، امروز ما عکس و ویدئو و صدا را هم با روش سنتی (جستجوی کلمات کلیدی یا برچسب و عنوان و …) پیدا میکنیم.
جستجوی آینده
در آینده جستجو بر اساس درک ماشین از معنا و مفهوم اطلاعات شکل میگیرد: وب معنایی.
نرمافزارهای امروز درکی از معنای اطلاعات ندارند، آنها تنها در یک بانک اطلاعاتی که به اطلاعات به شکل یک رشته نگاه میکند به دنبال کلمات کلیدی که کاربر وارد کرده میگردند، اما اگر نرمافزارها بتوانند معنای اطلاعات را بفهمند، جستجو در میان اطلاعات سادهتر، دقیقتر و کاراتر میشود. این چیزی است که میخواهم دربارهاش بیشتر صحبت کنم: وب معنایی
این آینده در واقع خیلی هم از ما دور نیست، بخشی از زیرساخت مورد نیاز همین حالا هم فراهم است.
ادامه دارد…