Open Source Signal logo
Open Source SignalСигнал відкритих джерел
Issue #034 20 June 2026 Saturday Tool Radar EN + UKR

Open Source Signal

Сигнал відкритих джерел

Saturday OSINT tools, datasets and workflows for Ukrainian accountability work, evidence preservation, geolocation, researcher safety, data review and ethical verification.

Saturday Tool Radar #034: OpenRoundup for multi-table wrangling, ArchiveWeb.page for interactive web capture, Wayback Machine APIs for archive checking, Overpass Turbo for OpenStreetMap queries, OpenSanctions for entity screening, Deportation Data Project for public-records detention data, and SMDT for social-media dataset normalization and redaction.

Editorial frame

What this is: A weekly tool radar for public-interest OSINT. Each item explains what the tool, dataset, release or workflow does, why it matters for Ukrainian accountability work, how to use it safely, and where its limits are.

What this is not: Doxxing, stalking, credential hunting, leaked-database abuse, private-person deanonymization, unsafe facial recognition, live targeting, or tools that facilitate harm against private people.

Rubric map

🧰 Data Wrangling
🗄️ Web Preservation
🕰️ Archive Checking
🗺️ Geospatial Queries
🧾 Entity Screening
🏛️ Public Records Data
🛡️ Research Data Hygiene
🧰Data WranglingРобота з даними
#01

OpenRoundup turns multi-table wrangling into a reviewable browser workflow

Source: arXiv · 10 June 2026

What happened

OpenRoundup is presented as an open-source, browser-based system for consolidating multiple independently published tables into an analysis-ready output without writing code. The paper describes a client-only architecture using DuckDB-WASM, live schema previews, data-quality alerts and a visual operation tree.

Why it matters

Accountability projects often combine casualty tables, sanctions files, procurement records, court lists, company registers and local incident logs. A browser-based, reviewable workflow is useful when the team needs to explain how separate tables became one dataset.

How to use it

Use it for non-secret, reviewable table consolidation: import copies of source tables, record each Stack or Pack operation, export the resulting table and save the operation notes with the evidence file. Keep original files, hashes and source URLs outside the tool as the evidence baseline.

Limits

This is a research prototype, not a full evidence-management system. It does not replace source preservation, data provenance, access control, human review or legal assessment of sensitive tables.

OpenRoundup перетворює роботу з кількома таблицями на перевірюваний процес у браузері

Джерело: arXiv · 10 червня 2026

Що сталося

OpenRoundup подано як відкриту браузерну систему для об’єднання кількох незалежно опублікованих таблиць в один набір, готовий до аналізу, без написання коду. У статті описано клієнтську архітектуру на DuckDB-WASM, попередній перегляд схем, попередження про якість даних і візуальне дерево операцій.

Чому це важливо

Проєкти з притягнення до відповідальності часто поєднують таблиці втрат, санкційні списки, закупівельні записи, судові переліки, реєстри компаній і локальні журнали інцидентів. Браузерний і перевірюваний процес корисний тоді, коли команда має пояснити, як окремі таблиці стали одним набором даних.

Як це застосувати

Використовуйте його для не таємного й перевірюваного об’єднання таблиць: імпортуйте копії джерел, фіксуйте кожну операцію Stack або Pack, експортуйте результат і зберігайте примітки про операції разом із доказовим файлом. Оригінальні файли, хеші й URL джерел треба зберігати окремо як базовий доказовий шар.

Обмеження

Це дослідницький прототип, а не повна система керування доказами. Він не замінює збереження джерел, фіксацію походження даних, контроль доступу, людську перевірку або юридичну оцінку чутливих таблиць.

data-wranglingopenroundupduckdb-wasmdata-journalismtoolbox
🗄️Web PreservationЗбереження вебсторінок
#02

ArchiveWeb.page is a manual capture tool for pages that crawlers miss

Source: Webrecorder · accessed 20 June 2026

What happened

ArchiveWeb.page is Webrecorder’s browser extension and desktop application for interactive web archiving as a user browses. The tool is designed for capturing web archives manually and viewing them later through ReplayWeb.page.

Why it matters

Many evidence pages are dynamic: platform posts, maps, dashboards, embedded media, language switchers and pages that require user interaction. A manual browser capture can preserve context that a simple screenshot or automated crawl may miss.

How to use it

Use it in a clean browser profile or isolated VM. Capture the page, export WACZ or WARC where available, record the URL, account state if relevant, timestamp, browser version, capture notes and a screenshot of the final view.

Limits

Manual capture is not neutral by default: logged-in state, cookies, language, geolocation, browser extensions and scrolling choices can change what is captured. Do not use it to collect private or access-controlled material without a legal and editorial basis.

ArchiveWeb.page допомагає вручну зберігати сторінки, які погано бере автоматичний збирач

Джерело: Webrecorder · перевірено 20 червня 2026

Що сталося

ArchiveWeb.page — це розширення для браузера й окрема програма Webrecorder для інтерактивного збереження вебсторінок під час перегляду. Інструмент призначений для ручного створення вебархівів і подальшого перегляду через ReplayWeb.page.

Чому це важливо

Багато доказових сторінок є динамічними: дописи на платформах, мапи, панелі даних, вбудовані медіа, перемикачі мов і сторінки, що потребують взаємодії. Ручне збереження в браузері може зафіксувати контекст, який пропустить звичайний знімок екрана або автоматичний збір.

Як це застосувати

Запускайте його в чистому профілі браузера або ізольованій віртуальній машині. Збережіть сторінку, експортуйте WACZ або WARC за можливості, запишіть URL, стан облікового запису за потреби, час, версію браузера, примітки щодо збереження і знімок фінального вигляду.

Обмеження

Ручне збереження не є нейтральним автоматично: стан входу, cookie, мова, геолокація, розширення браузера і вибір прокручування можуть змінити те, що потрапить до архіву. Не використовуйте інструмент для збору приватних або закритих матеріалів без правової й редакційної підстави.

web-archivingarchiveweb-pagewaczwarcevidence-preservation
🕰️Archive CheckingПеревірка архівів
#03

Wayback Machine APIs turn archive status into a checkable field

Source: Internet Archive · accessed 20 June 2026

What happened

The Internet Archive documents Wayback Machine APIs for checking whether a URL has an archived and accessible capture, including the availability API and references to CDX Server querying. Save Page Now can capture a page as it appears at the time of saving.

Why it matters

For public evidence, archive status is not just a link. It is a field: whether a URL was captured, when, with what status code, and whether the archived copy is accessible for future review.

How to use it

For each source URL, record the live URL, first-seen time, Wayback availability result, snapshot timestamp, HTTP status, Save Page Now attempt if used and any reason the page could not be archived.

Limits

The Wayback Machine does not prove authorship, completeness or authenticity by itself. Some pages are excluded, blocked, partial, delayed or transformed; sensitive personal data should not be amplified through archiving without review.

API Wayback Machine перетворюють архівний статус на окреме поле перевірки

Джерело: Internet Archive · перевірено 20 червня 2026

Що сталося

Internet Archive документує API Wayback Machine для перевірки, чи має URL доступну архівну копію, зокрема API доступності та запити через CDX Server. Save Page Now дозволяє зберегти сторінку в тому вигляді, у якому вона була під час збереження.

Чому це важливо

Для публічних доказів архівний статус — це не просто посилання. Це окреме поле: чи було URL збережено, коли саме, з яким кодом відповіді та чи доступна архівна копія для майбутньої перевірки.

Як це застосувати

Для кожного URL джерела записуйте живе посилання, час першого виявлення, результат перевірки Wayback, час архівної копії, HTTP-статус, спробу Save Page Now за наявності та причину, якщо сторінку не вдалося зберегти.

Обмеження

Wayback Machine сам по собі не доводить авторство, повноту або автентичність. Деякі сторінки вилучені, заблоковані, неповні, затримані або змінені під час збереження; чутливі персональні дані не слід поширювати через архівування без перевірки.

wayback-machinearchive-checkingsave-page-nowsource-statustoolbox
🗺️Geospatial QueriesГеопросторові запити
#04

Overpass Turbo is still the safest first workbench for OSM lead generation

Source: Overpass Turbo · accessed 20 June 2026

What happened

Overpass Turbo provides an interactive map, data view, wizard, export functions and examples for querying OpenStreetMap data through Overpass. It lets researchers search for objects by tags, geography and bounding boxes before moving to heavier GIS work.

Why it matters

For geolocation and infrastructure research, OSM is often the first structured map layer: bridges, roads, railway stops, hospitals, schools, industrial sites and administrative boundaries. Querying it safely helps build leads without jumping straight to private data or live targeting.

How to use it

Use small bounding boxes, clear tag logic, exported GeoJSON and saved query text. Record the date of the OSM data, query, area, tags used and later visual confirmation from independent imagery or official data.

Limits

OSM is edited by volunteers and can be incomplete, outdated or intentionally changed. Do not publish sensitive facility details, exact vulnerabilities, private addresses or tactical route analysis based only on OSM.

Overpass Turbo лишається безпечним першим робочим місцем для пошуку зачіпок в OpenStreetMap

Джерело: Overpass Turbo · перевірено 20 червня 2026

Що сталося

Overpass Turbo має інтерактивну мапу, перегляд даних, помічник для запитів, експорт і приклади для роботи з даними OpenStreetMap через Overpass. Він дозволяє шукати об’єкти за тегами, географією та межами ділянки перед переходом до важчої роботи в GIS.

Чому це важливо

Для геолокації й дослідження інфраструктури OpenStreetMap часто є першим структурованим шаром: мости, дороги, залізничні зупинки, лікарні, школи, промислові об’єкти й адміністративні межі. Безпечні запити допомагають збирати зачіпки без переходу до приватних даних або поточного наведення.

Як це застосувати

Використовуйте невеликі межі пошуку, зрозумілу логіку тегів, експорт GeoJSON і збережений текст запиту. Фіксуйте дату даних OpenStreetMap, сам запит, ділянку, використані теги й подальше візуальне підтвердження через незалежні знімки або офіційні дані.

Обмеження

OpenStreetMap редагують волонтери, тому дані можуть бути неповними, застарілими або навмисно зміненими. Не публікуйте чутливі деталі об’єктів, точні вразливості, приватні адреси або тактичний аналіз маршрутів лише на основі OpenStreetMap.

overpass-turboopenstreetmapgeolocationgeospatial-queriestoolbox
🧾Entity ScreeningПеревірка суб’єктів
#05

OpenSanctions is a structured starting point for names, entities and maritime flags

Source: OpenSanctions · updated 20 June 2026

What happened

OpenSanctions describes itself as an open-source database of sanctions, watchlists and politically exposed persons, aggregating hundreds of sources for compliance teams, investigators and journalists. Its site lists more than two million entities and hundreds of data sources, with specialised collections for sanctions, PEPs, maritime-related sanctions, regulatory watchlists and more.

Why it matters

For Ukraine-facing investigations, names and entities recur across sanctions, procurement, shipping, occupied-territory administration, ownership chains and war-related business. A structured screening source helps avoid one-off name searches that miss transliteration and duplicate problems.

How to use it

Use it as an entity-screening layer: record the searched name, identifiers, source dataset, match score or rationale, source date, aliases, sanctions program and whether a human reviewer accepted or rejected the match.

Limits

Screening is not proof of wrongdoing. Name matches can be false positives, incomplete or out of date; licensing differs for non-commercial and commercial use. Do not publish accusations against private people from a fuzzy match.

OpenSanctions дає структурований старт для перевірки імен, компаній і морських ознак

Джерело: OpenSanctions · оновлено 20 червня 2026

Що сталося

OpenSanctions описує себе як відкриту базу санкцій, контрольних списків і політично значущих осіб, що агрегує сотні джерел для комплаєнсу, розслідувачів і журналістів. Сайт показує понад два мільйони суб’єктів і сотні джерел, а також окремі колекції щодо санкцій, політично значущих осіб, морських санкцій, регуляторних списків тощо.

Чому це важливо

В українських розслідуваннях імена й суб’єкти повторюються в санкціях, закупівлях, судноплавстві, адміністраціях на окупованих територіях, ланцюгах власності й бізнесі, пов’язаному з війною. Структуроване джерело для перевірки допомагає не покладатися на разові пошуки імен, які пропускають проблеми транслітерації й дублів.

Як це застосувати

Використовуйте його як шар перевірки суб’єктів: записуйте шукане ім’я, ідентифікатори, набір даних, оцінку або підставу збігу, дату джерела, псевдоніми, санкційну програму і рішення людського перевіряча щодо прийняття або відхилення збігу.

Обмеження

Перевірка в списках не є доказом правопорушення. Збіги імен можуть бути хибними, неповними або застарілими; умови ліцензування різняться для некомерційного й комерційного використання. Не публікуйте звинувачення проти приватних осіб на основі нечіткого збігу.

opensanctionsentity-screeningsanctionspep-datamaritime-sanctions
🏛️Public Records DataДані з публічних запитів
#06

Deportation Data Project shows how litigation data becomes an evidence portal

Source: Deportation Data Project · accessed 20 June 2026

What happened

The Deportation Data Project obtains, posts and analyzes U.S. immigration enforcement data through public-records litigation. It provides processed and original data, documentation, data guides and tools for arrests, detainers, detention stays, detention facilities, field offices and immigration court cases.

Why it matters

The method is portable even when the topic is U.S.-specific. For accountability work, it is a model of how to publish official records with codebooks, original files, processed tables, dashboards, documentation and limits.

How to use it

Use it as a template for record-based portals: keep original documents, processed tables, codebooks, update dates, field definitions, derived metrics, FOIA or litigation notes and warnings about missing or suppressed values.

Limits

The data concerns immigration enforcement in the United States and should not be treated as a direct Ukraine dataset. Individual-level data can create risk; publish aggregates, redactions and context where needed.

Deportation Data Project показує, як дані з судових і публічних запитів стають доказовим порталом

Джерело: Deportation Data Project · перевірено 20 червня 2026

Що сталося

Deportation Data Project отримує, публікує й аналізує дані імміграційного контролю США через судові та публічні запити. Проєкт надає оброблені й первинні дані, документацію, довідники й інструменти щодо арештів, запитів на затримання, перебування в ізоляторах, установ тримання, польових офісів і справ в імміграційних судах.

Чому це важливо

Метод можна переносити на інші теми, навіть якщо сам набір даних стосується США. Для роботи з притягнення до відповідальності це модель публікації офіційних записів із кодбуками, оригіналами, обробленими таблицями, панелями даних, документацією і межами використання.

Як це застосувати

Використовуйте його як шаблон для порталів на основі офіційних записів: зберігайте оригінальні документи, оброблені таблиці, кодбуки, дати оновлення, визначення полів, похідні показники, примітки щодо публічних або судових запитів і попередження про пропуски чи приховані значення.

Обмеження

Дані стосуються імміграційного контролю США і не є прямим українським набором даних. Дані на рівні окремих людей можуть створювати ризики; за потреби публікуйте агрегати, редаговані версії та контекст.

public-recordsdata-portalfoiadetention-datadocumentation
🛡️Research Data HygieneГігієна дослідницьких даних
#07

SMDT makes social-media datasets easier to normalize and redact before analysis

Source: ViralLab / GitHub · accessed 20 June 2026

What happened

Social Media Data Toolkit is a Python toolkit for ingesting, normalizing, enriching and analyzing social-media data. Its repository describes support for standardizing raw exports from platforms such as Twitter/X, Bluesky and Truth Social into normalized tables, with anonymization and redaction helpers before sharing datasets.

Why it matters

Platform evidence is often messy and sensitive. A common schema and redaction step can help teams compare posts, accounts, actions and entities while reducing the chance of leaking private identifiers during collaboration.

How to use it

Use it on lawful exports or approved research datasets only. Normalize copies, run redaction or pseudonymization before sharing, export analysis tables, and keep a separate access-controlled file that maps pseudonyms to original identifiers where retention is lawful and necessary.

Limits

A schema does not make scraping lawful or safe. Do not use it to deanonymize private people, bypass platform rules, publish personal data, or share datasets that identify witnesses, victims, minors or vulnerable contacts.

SMDT допомагає уніфікувати й редагувати набори даних із соціальних платформ перед аналізом

Джерело: ViralLab / GitHub · перевірено 20 червня 2026

Що сталося

Social Media Data Toolkit — це Python-інструмент для завантаження, уніфікації, збагачення й аналізу даних із соціальних платформ. Репозиторій описує перетворення сирих експортів із Twitter/X, Bluesky і Truth Social у нормалізовані таблиці, а також допоміжні засоби для анонімізації й редагування перед передаванням наборів даних.

Чому це важливо

Докази з платформ часто неструктуровані й чутливі. Спільна схема й етап редагування допомагають командам порівнювати дописи, акаунти, дії та сутності, зменшуючи ризик витоку приватних ідентифікаторів під час співпраці.

Як це застосувати

Використовуйте його лише для законних експортів або затверджених дослідницьких наборів даних. Уніфікуйте копії, застосовуйте редагування або псевдонімізацію перед передаванням, експортуйте аналітичні таблиці й окремо зберігайте файл відповідності між псевдонімами та первинними ідентифікаторами лише там, де це законно й потрібно.

Обмеження

Спільна схема не робить збір даних законним або безпечним. Не використовуйте її для деанонімізації приватних осіб, обходу правил платформ, публікації персональних даних або передавання наборів, що ідентифікують свідків, постраждалих, неповнолітніх чи вразливі контакти.

social-media-datasmdtredactionpseudonymizationresearch-opsec