GovTech BETA
Platforma Konkursowa
Inteligentny robot do walki z cyberprzestępczością
OBSERWUJ KONKURS
Otrzymasz powiadomienia o zmianach i upływających terminach
kiedy można wysyłać zgłoszenia
od 12.09.2019 do 28.10.2019
pula nagród
55 000,00 zł brutto
maksymalny budżet wdrożenia
550 000,00 zł brutto
Funkcjonowanie dziś, opis potrzeby

Funkcjonariusze KAS śledzą każdego roku tysiące aukcji, ogłoszeń i stron w Internecie związanych z hazardem, przemytem papierosów, alkoholu, narkotyków i wielu innych nielegalnych towarów. Znalezienie ich wśród milionów stron jest zadaniem pochłaniającym ogromną miarę czasu. Znaczna część stron nie jest możliwa do znalezienia przy pomocy dostępnych wyszukiwarek internetowych.

Oczekiwana zmiana

Oczekiwane rozwiązanie automatycznie wyszuka strony internetowe podobne do wypracowanego uprzednio modelu wzorcowej strony internetowej. Wynikiem działania będą miejsca w Internecie (strony internetowe), które nie były wcześniej znane użytkownikowi. Wskazane i wymagane jest by rozwiązanie wyszukiwało również miejsca nieindeksowane przez popularne silniki wyszukiwarek internetowych (tzw. deep web). Zamierzeniem jest ułatwienie użytkownikowi znalezienia takich miejsc w Internecie, gdzie ma miejsce łamanie prawa bądź występują nieprawidłowości w obszarze zainteresowania KAS, a także usprawnienie i szybsze wyszukiwanie tych miejsc.

Wymagania funkcjonalne

Oprogramowanie, które w zautomatyzowany sposób wyszuka w sieci Internet oraz Dark Web strony o parametrach skojarzonych, podobnych lub powiązanych do wskazanych przez użytkownika przy pomocy wyszukiwania tekstem i wyszukiwania grafik. W przyszłości, uwzględniając modularność rozwiązania, powinno oferować wyszukiwanie w sieci darknet. Rozwiązanie Konkursowe będzie posiadać funkcję douczania systemu rozpoznającego strony w zakresie nowo gromadzonych danych – aktualizowanie modelu strony wzorcowej; wielokrotne uruchamianie modułu budowy strony wzorcowej aż do osiągnięcia satysfakcjonującego wyniku, o którym decyduje użytkownik.

Oprogramowanie będzie posiadać własny system programowalnych robotów sieciowych z uczeniem maszynowym (jest to funkcjonalność kluczowa) i przeszukiwać Internet oraz Dark Web w sposób zanonimizowany. Algorytm powinien uwzględniać strony wcześniej niezindeksowane oraz nie może opierać swojego działania wyłącznie na popularnych wyszukiwarkach typu: google, bing, duckduckgo, yahoo, yandex itp.

Rozwiązanie Konkursowe będzie zapewniało wyszukiwanie stron internetowych na serwerach o zadanym numerze IP, bądź zadanym zakresie numerów IP.

Wyniki działania oprogramowania będą archiwizowane w formatach np. MHTML, JPG/PNG. Z wyszukanych stron internetowych będą pobierane dane umożliwiające identyfikację administratora/abonenta/rejestratora strony (np. dane typu numer telefonu, adres e-mail, numer NIP, numer REGON, numer konta bankowego, raport whois, raport Alexa, Google Analitics itp.) zapisane w sposób możliwy do analizy w aplikacjach zewnętrznych takich jak arkusze kalkulacyjne czy programy do obsługi baz danych. Wykorzystanie usług firm zewnętrznych w powyższym zakresie w przypadku oferowania przez te firmy API będzie zapewnione, przy czym ewentualne koszty będą zawarte w wycenie szukanego rozwiązania.

Wyniki działania będą zawierać m.in.:

  • adresy stron internetowych
  • współczynnik określający stopień podobieństwa wyszukanych stron do modelu
  • adres IP wraz z danymi abonenta i rejestratora strony
  • ranking popularności strony w Internecie

Oczekiwane Rozwiązanie Konkursowe będzie rozwiązaniem modularnym, co pozwoli na wprowadzanie w przyszłości dodatkowej funkcjonalności. W związku z powyższym rozwiązanie (w formie plug-inów, bibliotek rozszerzających funkcjonalność) będzie posiadać dobrze opisane interfejsy, tak by możliwe było dalsze rozwijanie powdrożeniowo, we własnym zakresie.

Przykładowe dodatkowe funkcjonalności to:

  • Analiza dowolnych dokumentów (jpeg, gif, pdf, doc, itp.) i ekstrakcja z nich możliwych metadanych i danych, w tym analiza obrazu (OCR – Optical Character Recognition) w kontekście wyszukiwania numerów telefonów i adresów e-mail.
  • Technologia deep web (Tor, I2P, Freenet itp.) i możliwość wyszukiwania przy pomocy ich mechanizmów dostępowych.
  • Obsługa social media (np. marketplace Facebook) i ich specyficznych form ochrony dostępu do treści.
  • Obsługa różnych języków, przy czym na wstępie powinien być obsługiwany język polski, a kolejne możliwe języki jako opcje.

Od strony Zamawiającego nie ma przeszkód by powyższe funkcjonalności były już zaimplementowane w Rozwiązaniu Konkursowym.

Użytkownicy i oczekiwana przez nich funkcjonalność podstawowa
Inspektor
Użytkownik powinien mieć możliwość budowy i trenowania modelu według następującego schematu:

• użytkownik wskazuje słowa kluczowe (algorytm uzupełnia o synonimy oraz odmiany fleksyjne), stron internetowych, obrazy na podstawie, których algorytm wyszukuje strony podobne
• algorytm wyszukuje strony podobne na bazie podanych parametrów
• użytkownik wskazuje strony pozytywne tzn. do których wyniki mają być podobne
• użytkownik wskazuje strony negatywne tzn. do których wyniki nie mają być podobne
• algorytm wyszukuje strony podobne uwzględniając wszystkie powyższe wskazania użytkownik może wielokrotnie trenować model służący do wyszukiwania w powyższy sposób.
Sposób wyboru najlepszego partnera do współpracy
Harmonogram
Zgłoszenia do 28.10.2019
Weryfikacja zgłoszeń do 01.11.2019
Przyjmowanie rozwiązań - I etap od 08.11.2019 do 28.11.2019
Ocena propozycji 12.12.2019
Przyjmowanie rozwiązań - II etap od 08.01.2020
Ogłoszenie wyników do 24.02.2020
Szczegóły I etapu konkursu

Rozwiązanie Konkursowe to program komputerowy instalowany w środowisku MS Windows 64-bit zawierające instrukcję obsługi (w tym instalacji). Wymagania związane ze sprzętem komputerowym są determinowane przez ww. system. Preferowany nośnik oprogramowania to płyta DVD dostarczona na adres Zamawiającego. Rozwiązanie Konkursowe, nośnik oraz dokumentacja nie mogą identyfikować Uczestnika Konkursu - niezastosowanie powoduje wykluczenie Uczestnika z Konkursu.

Praca Konkursowa powinna zawierać:

a) część opisową, na którą składa się:

- strona tytułowa oznaczona liczbą rozpoznawczą, o której mowa w punkcie 10.9. Regulaminu Konkursu;

- instrukcja obsługi/instalacji w języku polskim;

- szacunkowy koszt wykonania rozwiązania realizowanego na podstawie pracy konkursowej.

b) część elektroniczna, na którą składa się oprogramowanie dostarczone na dowolnym nośniku danych;

na etapie I Konkursu Zamawiający nie wyklucza wersji tzw. portable, niewymagającej instalacji. Dostarczone oprogramowanie musi zawierać wszelkie niezbędne składniki potrzebne do uruchomienia programu wykonywalnego i przeprowadzenia testów (w tym klucze API jeżeli są wymagane).

Etap I: 16 oprogramowanie prototyp, oceniana będzie tylko zdolność wyszukiwania stron podobnych.

Pliki składające się na pracę konkursową należy przesłać przez Platformę Konkursową lub pocztą na adres Zamawiającego. W przypadku przesyłki pocztą - instrukcja jej przygotowania znajduje się w treści regulaminu.

Kryteria oceny I etapu
Skuteczność modelu - waga 60%
Szczegółowy opis oceny zawiera załącznik nr 3 do regulaminu
Koncepcja - waga 40%
Szczegółowy opis oceny zawiera załącznik nr 3 do regulaminu
W pierwszym etapie autorzy najlepszych prac otrzymają nagrody finansowe oraz zaproszenie do złożenia prac w drugim etapie
1 miejsce: 22 000,00 PLN
2 miejsce: 15 000,00 PLN
3 miejsce: 10 000,00 PLN
4 miejsce: 5 000,00 PLN
5 miejsce: 3 000,00 PLN
Szczegóły II etapu konkursu

Rozwiązanie Konkursowe to program komputerowy instalowany w środowisku MS Windows 64-bit zawierające instrukcję obsługi (w tym instalacji). Wymagania związane ze sprzętem komputerowym są determinowane przez ww. system. Preferowany nośnik oprogramowania to płyta DVD dostarczona na adres Zamawiającego. Rozwiązanie Konkursowe, nośnik oraz dokumentacja nie mogą identyfikować Uczestnika Konkursu - niezastosowanie powoduje wykluczenie Uczestnika z Konkursu.

Kryteria oceny II etapu
Skuteczność modelu - waga 70%
Szczegółowy opis oceny zawiera załącznik nr 3 do regulaminu
Szybkość - waga 10%
Szczegółowy opis oceny zawiera załącznik nr 3 do regulaminu
Koncepcja - waga 20%
Szczegółowy opis oceny zawiera załącznik nr 3 do regulaminu
Nagroda dla najlepszej pracy w II etapie
Nagrodą w II etapie jest zaproszenie do negocjacji umowy na wykonanie całości systemu (wykonanie uszczegółowienia pracy konkursowej)
Kluczowe zapisy umowy na uszczegółowienie rozwiązania
Zasady dotyczące praw autorskich majątkowych oraz licencji zwrotnej
Przyjęcie wszystkich praw majątkowych na wszystkich polach eksploatacji, tak by zamawiający miał prawo rozwoju rozwiązania w dowolnym kierunku oraz udzielenie licencji zwrotnej wykonawcy, tak by miał możliwość dalszego rozwijania we własnym zakresie. Uzyskanie kodów źródłowych.
Kontakt
Zamawiający udziela odpowiedzi pod warunkiem, że pytanie lub wniosek o wyjaśnienie zawartości Regulaminu wpłynie dwa dni przez terminem składania wniosku lub Rozwiązań. Jeżeli prośba o wyjaśnienie treści Regulaminu wpłynęła po upływie terminu lub dotyczy udzielonych już odpowiedzi i wyjaśnień, Zamawiający może udzielić wyjaśnień albo pozostawić takie pytania bez rozpoznania.
Komunikacja z uczestnikami prowadzona jest w formie elektronicznej, pocztą email lub przez Platformę Konkursową.
Agnieszka Szymańska
tel. 774403270
agnieszka.szymanska3@mf.gov.pl
Pytania i odpowiedzi
Dokumentacja postępowania
TAGI
wyszukiwanie nadużyć