آموزش وب اسکرپینگ با پایتون (web scraping)
وب اسکرپینگ ابزاریست برای ارتباط با دنیای وب از طریق کدنویسی. اگر بخواهیم نگاهی عمیقتر به موضوع داشته باشیم باید گفت ماده، انرژی و اطلاعات سه مفهوم اصلی تشکیل دهندهی دنیا هستند، که تمام محصولات و خدماتی که در دنیای بشری ارزش مادی دارند، ریشه در یکی از این سه مفهوم دارد. یکی از منابعی که میتوان از طریق آن به اطلاعات دسترسی داشت، دنیای وب میباشد. دنیای وب شامل شبکههای اجتماعی، فروشگاههای آنلاین، نتایج موتورهای جستجو و به صورت کلی هر چیزیست که ممکن است در یک مرورگر با آن مواجه شویم. اما دادههای وب دارای چه مزیتی نسبت به سایر منابع اطلاعات هستند؟ سه مزیت اصلی دادههای وب شامل 1- در دسترس بودن و 2- به روز بودن و 3- سرعت بالا در دسترسی و انتقال آنهاست. اطلاعات دنیای وب هر روزه با توجه به نیازهای جامعه بشری و شرایطی که انسانها در آن زندگی میکنند در حال تغییر است و البته در هر جایی که اینترنت وجود دارد، این اطلاعات در دسترس هستند. دادهها که در واقع منشا تولید اطلاعات هستند، از دیدگاه محصول، فرآیند تولید راحتتری نسبت به محصولات فیزیکی دارند. در واقع محصولاتی که بر پایهی اطلاعات تولید میشوند، تنها نیاز به منابع داده و مصرف کمی انرژی دارند. اطلاعات به واقع بخش مفیدی است، که از منابع دادهای استخراج میشود و چیزی شبیه به طلا است، که از دل معادن استخراج میشود. وب اسکرپینگ ابزاری برای استخراج این دادهها از دنیای وب است. در واقع با تکیه بر قدرت پردازشی کامپیوترها، این امکان فراهم شدهاست، که بتوانیم حجم بسیار زیادی از دادهها را از دنیای وب استخراج کنیم. از طرفی باید توجه داشت، که الگوهایی که در داخل این دادهها قرار دارند، میتوانند بر روی تصمیماتی که در کسب و کارها گرفته میشود، تاثیرگذار باشند. به بیان دیگر، بسیاری از الگوها فقط با دادهکاوی در حجم بسیار زیادی از دادهها قابل مشاهده هستند که این مهم تنها با قابلیت پردازشی کامپیوترها و ابزاری مثل وب اسکرپینگ قابل انجام است
313,650 تومان