شايد براي شما هم پيش آمده، دسترسي به يك بانك اطلاعات داريد، جستجو ميكنيد و متن را در صفحات وب در قالب HTML دريافت مينماييد. طبيعتاً ذخيره ميكنيد و بعد كه ميخواهيد استفاده كنيد، حجم زيادي مطالب بيربط و تبليغات دورتادور مطلب را گرفته است.
من از بانك اطلاعات فرهنگستان علوم اسلامي خيلي استفاده ميكردم، وقتي كه آنجا بودم، بعد از اينكه تمامي حدود هفت هزار جزوه مباحث استاد حسيني (ره) درون اين بانك قرار گرفت. صفحات HTML را كه ذخيره ميكردم، اين نرمافزار را كنار آنها كپي كرده و يكبار اجرا ميكردم. فوري تمام صفحات HTML را باز كرده، تگهاي ابتدا و انتهاي متن را پيدا نموده و متن جزوه را استخراج كرده و در فايلي با فرمت TXT ذخيره ميكرد. بعد هم فايلهاي HTML تبديل شده را به پوشهاي با همين نام منتقل ميساخت.
سورس اين برنامه به زبان VB۶ است. ميتوانيد تگ ابتدا و انتها را متناسب با منابع خود تغيير داده و متنهاي مورد نظر خود را استخراج نماييد.
فايلهاي ضميمه را ميتوانيد به صورت رايگان از لينكهاي زير دريافت نماييد.
دانلود: ۷۰۵ بار
همه چيز را همگان دانند. اگر مطلب فوق را مطالعه فرمودهايد، نظر خود را بيان نماييد:
حذف تگ
يكشنبه ۴ آذر ۱۳۹۷استفاده در جمعبندي مطالعه
شنبه ۴ شهريور ۱۴۰۲تشكر
دوشنبه ۱۷ مهر ۱۴۰۲