توضیحات
یک سیستم اتوماسیون خبری کامل و آمادهی راهاندازی است که با Python نوشته شده و برای ناشران، خبرنگاران، مدیران کانالهای خبری و هر کسی که میخواهد یک جریان خبری خودکار و حرفهای داشته باشد طراحی شده است.
این سیستم به صورت کاملاً خودکار، هر ۱۰ دقیقه یکبار یک چرخهی کامل خبری را طی میکند:
از **کشف خبر** در سایتهای خبری ایرانی، تا استخراج و پاکسازی محتوا، تا بازنویسی حرفهای با هوش مصنوعی، تا انتشار خودکار در کانالهای پیامرسان شما
پایپلاین ۴ مرحلهای — چطور کار میکند؟
مرحله ۱ ← کشف لینک → مرحله ۲ ← استخراج محتوا → مرحله ۳ ← بازنویسی AI → مرحله ۴ ← انتشار
مرحله ۱ — Crawler (کشف خودکار اخبار)
سیستم بهصورت خودکار آرشیو سایتهای خبری معتبر ایرانی از جمله ایسنا، ایرنا، مهر، بُرنا، ایلنا و آنا را پایش میکند و لینکهای جدید را کشف و در دیتابیس ثبت میکند. میتوانید هر منبع را بهصورت جداگانه از طریق فایل `.env` فعال یا غیرفعال کنید.
مرحله ۲ — Scraper (استخراج و پاکسازی محتوا)
برای هر لینک جدید، سیستم وارد صفحهی خبر میشود، عنوان، متن اصلی، تاریخ انتشار و تصویر شاخص را استخراج میکند. HTML خام پاکسازی میشود و فقط محتوای مفید نگه داشته میشود. اگر تصویر یا متن خالی باشد، مقاله بهطور خودکار رد میشود تا کیفیت انتشار حفظ شود.
مرحله ۳ — AI Rewrite (بازنویسی با هوش مصنوعی)
متن خبر برای مدل GPT-4o-mini ارسال میشود. هوش مصنوعی با پرامپت فارسی حرفهای، عنوان را جذابتر میکند، متن را خلاصه و روان بازنویسی میکند، هشتگهای مرتبط اضافه میکند و نام خبرگزاریها را حذف میکند. سیستم بهطور خودکار بین اخبار عادی و اخبار حساس/مهم تمایز قائل میشود و طول متن را بر اساس آن تنظیم میکند. خروجی همیشه JSON معتبر است.
مرحله ۴ — Publisher (انتشار چندسکویی)
محتوای بازنویسیشده همراه با تصویر و لینک منبع در کانالهای بله *روبیکا* و **ایتا** منتشر میشود. سیستم از انتشار تکراری جلوگیری میکند، محدودیت ۶ خبر در ساعت را رعایت میکند و وضعیت هر انتشار را ثبت میکند.
—
### Health Engine — پایپلاین جداگانه برای اخبار سلامت
علاوه بر پایپلاین اصلی، سیستم یک **موتور خبری سلامت** مستقل دارد که بهطور موازی اجرا میشود. این پایپلاین میتواند منابع خبری تخصصی حوزهی سلامت را دنبال کند و در همان کانالها یا کانالهای مجزا منتشر کند.
امکانات و ویژگیهای فنی
| ویژگی | جزئیات |
|—|—|
| منابع خبری پیشفرض | ایسنا، ایرنا، مهر، بُرنا، ایلنا، آنا |
| پلتفرمهای انتشار | بله (Bale) / روبیکا (Rubika) / ایتا (Eitaa) |
| موتور AI | OpenAI-compatible API (GapGPT / هر مدل سازگار) |
| دیتابیس | SQLite (پیشفرض) یا هر دیتابیس سازگار با SQLAlchemy |
| جلوگیری از تکرار | Content Hash + UniqueConstraint در دیتابیس |
| مدیریت خطا | Retry هوشمند تا ۸ بار + Circuit Breaker (بلوک ۴۵ دقیقهای منابع مشکلدار) |
| زمانبندی | اسکدیولر داخلی با چرخهی ۱۰ دقیقهای |
| لاگ سیستم | ثبت لاگ رنگی در کنسول + ذخیره در دیتابیس |
| محدودیت انتشار | حداکثر ۶ خبر در ساعت برای هر پلتفرم |
| تشخیص اخبار حساس | لیست کلمات کلیدی با تنظیم خودکار طول متن |
| فرمت خروجی AI | JSON معتبر با `response_format` |
| قابلیت پیکربندی | تمام پارامترها از طریق فایل `.env` |
برای چه کسانی مناسب است؟
– **مدیران کانالهای خبری** در بله، روبیکا و ایتا که میخواهند بدون صرف وقت روزانه، محتوای تازه و حرفهای منتشر کنند
– **فعالان رسانهای و خبرنگاران** که نیاز به یک سیستم پایش و جمعآوری خبر دارند
– **توسعهدهندگان** که میخواهند پایپلاین خبری سفارشیشده برای پروژههای خودشان راه بیندازند
– **کسبوکارها** که میخواهند یک کانال خبری برندشده با محتوای اتوماتیک داشته باشند
نصب و راهاندازی
راهاندازی کامل سیستم در کمتر از ۳۰ دقیقه:
1. Python 3.10+ نصب باشد
2. پکیجهای مورد نیاز با `pip install -r requirements.txt` نصب شوند
3. فایل `.env` با توکنهای پیامرسان و کلید API هوش مصنوعی تنظیم شود
4. دیتابیس با `python init_db.py` ساخته شود
5. با دستور `python main.py` سیستم اجرا شود
از آن لحظه به بعد، سیستم بهصورت کاملاً خودکار هر ۱۰ دقیقه یکبار خبر جمعآوری، بازنویسی و منتشر میکند.
آنچه دریافت میکنید
– کد کامل پروژه (Python)
– مستندات فارسی کامل (README)
– راهنمای پیکربندی `.env`
– ساختار دیتابیس آماده
# نیازمندیها
– Python 3.10+
– یک API Key از GapGPT یا هر سرویس سازگار با OpenAI API
– توکن ربات برای بله، روبیکا یا ایتا (بسته به پلتفرم انتخابی)
– سرور یا VPS برای اجرای مداوم (اختیاری — روی لپتاپ هم اجرا میشود)
*این محصول کد منبع کامل است و نه یک اپلیکیشن آماده. برای راهاندازی به آشنایی ابتدایی با Python و خط فرمان نیاز دارید.*


نقد و بررسیها
هنوز بررسیای ثبت نشده است.