מערכת לcrawling של אתר עם יכולות HTTPS ו-CAPTCHA פשוט
Project # 15798
Job Statistics
4 Bids |
budget
Budget Unknown
|
bidding ends in
|
bid range
-
|
average bid
-
|
Job Info And Actions
Posted:
10:02, 11 Dec., 2010
Ends:
18:35, 8 Jan., 2011
מערכת לcrawling של אתר עם יכולות HTTPS ו-CAPTCHA פשוט
אני מעוניין באיסוף מידע מאתר שמבקש בתחילה קפצ'ה, מאפשר הזנה של מאפיינים לבחירה ואז מחולל נתונים בהתם לבקשה, כל זאת נעשה ב-HTTPS.
המערכת צריכה לאסוף את הנתונים האלה מהאתר הנ"ל באמצעות crawler (יש ברשותי אחד מתוחכם מאוד שיכול להועיל, כתוב ב-C#)
השלבים:
* ניתוח ה-Captcha - למרות שהוא די בסיסי וישנם כלים שיכולים לעבור אותו
* המידע עובר ב-HTTPS - לא אמור להוות בעיה כי מן הסתם אנו יוזמים את הבקשה
* מאפיינים שצריך להעביר ב-POST
* שמירת הדף לפיענוח באמצעות XPATH
המערכת תעבוד מול אתר אחד כיום ולכן היא יכולה להיות ספציפית לגביה, המגבלות אופיינו כאן.
המערכת צריכה לאסוף את הנתונים האלה מהאתר הנ"ל באמצעות crawler (יש ברשותי אחד מתוחכם מאוד שיכול להועיל, כתוב ב-C#)
השלבים:
* ניתוח ה-Captcha - למרות שהוא די בסיסי וישנם כלים שיכולים לעבור אותו
* המידע עובר ב-HTTPS - לא אמור להוות בעיה כי מן הסתם אנו יוזמים את הבקשה
* מאפיינים שצריך להעביר ב-POST
* שמירת הדף לפיענוח באמצעות XPATH
המערכת תעבוד מול אתר אחד כיום ולכן היא יכולה להיות ספציפית לגביה, המגבלות אופיינו כאן.
skills required
attachments
Please sign in to access project files
the client
Please
sign in
to contact the client
updates
Please sign in to view project updates
Private Bid
4 projects
|
|
Bid from asafg
240 ILS
Per hour
6 projects
|
אסף גרי
אבטליון
שלום אריק,
יש לי נסיון רב בפיתוח בJava ולמעשה גם פתחתי Crawler בעבר. הוא עדיין נמצא אם איני על גבי שרתי SourcrForge כפרויקט קוד פתוח, אם כי לא תחזקתי אותו במשך כמה שנים טובות וספק אם הוא אפילו מתקמפל. בכל אופן, הניסיון קיים.
אשמח לקבל פרטים נוספים על מנת לראות איך ניתן להתקדם.
הטלפון שלי 054-2215733.
כתובת הדוא"ל asaf.gery@gmail.com
בברכה,
אסף גרי
|
Private Bid
3 projects
|
|
Private Bid
2 projects
|
|