Reddit: a centralização corrompe a privacidade

Reddit: a centralização corrompe a privacidade

a internet, onde todos têm chance de ser ouvidos, um sistema mais democrático - Aaron Schwartz, cofundador do Reddit

Reddit é uma plataforma de mídia social, agregador de notícias, vários milhares de fóruns, distribuidor de fotos de gatos, ocasionalmente hospeda conteúdo original e estilos próprios como "a primeira página da internet". O Reddit tem 50 bilhões de visualizações mensais (é como todo mundo checando o Reddit 1-2 vezes por semana) e 52 milhões de usuários ativos diariamente. [0]

Nos primeiros estágios de sua vida, o Reddit era conhecido como um defensor da privacidade, do anonimato e um oponente da censura. À medida que cresceu, a natureza centralizada do Reddit levou à venda de anúncios, coleta de dados do usuário e censura em nome de - e entrega de dados do usuário para - poderes estatais.

A julgar por sua política de privacidade, o Reddit não está tirando tanta licença com seus dados quanto, por exemplo, o WhatsApp, mas sua natureza centralizada tornou alguns desses problemas inevitáveis. Trata-se de uma grande empresa que precisa ser sustentável, ela coleta informações pessoais dos usuários para vender anúncios que não precisam ser estritamente do Reddit, e por ser um ponto centralizado de acesso permitido a esses dados, os governos podem exigir acesso a estes.

Sobre as concessões de dados pessoais, uma questão importante é "O que significaria para mim se todos os dados que forneço à esta empresa se tornassem públicos?"

Ceder dados pessoais não é apenas uma questão de o que uma empresa fará com eles, é uma questão de o que o mundo faria com seus dados: o que seus vizinhos fariam com seus dados, o que seus professores fariam com seus dados, o que seus alunos fariam com seus dados ... mas também, o que uma pessoa tentando chantagear você faria com seus dados. O que um governo que tenta capturar ou executar denunciantes faria com seus dados. O que uma agência de publicidade tentando controlar seu comportamento faria com seus dados.

Se isso faz você pensar duas vezes sobre o que está fazendo, lendo, postando, essa é uma consequência bem conhecida da vigilância, e o Reddit, por meio de centralização, publicidade e ordens do governo, vigia seus usuários.

Crescimento, sustentabilidade, publicidade


Como o Reddit é uma grande empresa que (presumivelmente) precisa se sustentar em mais do que apenas pagamentos do Reddit Gold - ou está apenas tentando maximizar o lucro, como as empresas centralizadas com fins lucrativos costumam fazer - o Reddit vende espaço publicitário. Ele suaviza o negócio, oferecendo anúncios personalizados e otimizados e informações analíticas aos anunciantes.

"O Reddit só compartilha informações não públicas sobre você das seguintes maneiras. [....]

Podemos compartilhar informações com fornecedores, consultores e outros provedores de serviços que precisam de acesso a essas informações para realizar o trabalho para nós. A utilização de dados pessoais estará sujeita a medidas de confidencialidade e segurança adequadas. Alguns exemplos: [...] (iii) fornecedores terceirizados de medição de anúncios que ajudam a nós e aos anunciantes a medir o desempenho dos anúncios exibidos em nossos Serviços. "

"Usamos informações sobre você para: [...]

• Monitorar e analisar tendências, o uso e atividades relacionadas aos nossos serviços;

• Medir a eficácia dos anúncios exibidos em nossos serviços; e

• Personalizar os serviços, fornecer e otimizar anúncios, conteúdo e recursos que correspondem aos perfis ou interesses do usuário. [fonte]"

Essa publicidade leva a uma regularização do conteúdo por meio de um processo de censura progressiva, pois os anunciantes financeiramente poderosos condicionam a parceria com o Reddit para a remoção de conteúdo que entre em conflito com as imagens de suas marcas.

Censura progressiva e erosão cultural


Essa é uma maneira pela qual a centralização leva à separação dos incentivos do usuário e da empresa. À medida que o Facebook e o Google atingiram seus estados quase onipresentes, suas operações envolvem cada vez mais coleta de dados, análises, perfis de usuários, inferências, vendas de publicidade, etc. A plataforma de mídia social e o mecanismo de pesquisa evidentemente ainda existem (no momento da redação 😈) , mas em vez de melhorar esses serviços básicos para fornecer uma melhor experiência do usuário, melhorias são feitas para outros fins. A experiência do usuário é apenas um pré-requisito (veja como o Google se posiciona sobre os dados de localização do usuário, por exemplo).

Existem alguns argumentos de que a publicidade não é inerentemente desalinhada em relação aos incentivos do usuário, mas, em última análise, tudo se resume a uma questão de saber se os anunciantes podem expressar o desejo de censurar o conteúdo que conflita com o desejo dos usuários de ver esse conteúdo (e se a plataforma Reddit, acha que vai administrar essa alienação de usuários). Os anunciantes geralmente desejam censurar o conteúdo, porque desejam proteger a imagem de sua marca.

Por exemplo, considere:

  1. Os usuários querem ver fotos de gatos
  2. Empresa de Produtos para Cachorros deseja anunciar no Reddit
  3. A Empresa de Produtos para Cachorros não quer que a imagem de sua marca aparece próximo a fotos de gatos
  4. A Empresa de Produtos para Cachorros paga ao Reddit por espaço publicitário condicionado à censura de fotos de gatos

Quer os usuários sejam bem atendidos ou não pelos anúncios da Empresa de Produtos para Cachorros, eles não podem mais ver fotos de gatos no Reddit. Repita esse processo à medida que uma empresa centralizada cresce, para servir apenas o conteúdo da interseção de "conteúdo aceitável" de seus anunciantes.

E como os anunciantes, e não os usuários, pagam o Reddit, o domínio do conteúdo aceitável continuará diminuindo. [1] Nosso sistema moral de conteúdo aceitável deve ser centralizado nas mãos dos anunciantes?

A informação centralizada leva a …

Como o Reddit coleta informações pessoais para "analisar tendências, uso e atividades", "medir a eficácia dos anúncios" e "fornecer e otimizar anúncios [...] que correspondam aos perfis ou interesses do usuário", é provável [2] que o Reddit tenha dados pessoais, informações de que não precisa estritamente para atuar como "a página inicial da Internet" (ou seja, fornecer sua funcionalidade não publicitária). Isso contrasta com as informações pessoais que estão intimamente ligadas à função geral do Reddit, por exemplo: "Se você criar uma conta do Reddit, podemos exigir que você forneça um nome de usuário e uma senha."

O Reddit é uma entidade centralizada. O Reddit controla esses dados, as informações pessoais "necessárias" e "desnecessárias" coletadas - de 52 milhões de usuários ativos diariamente. [0]

Concentrações de informações do usuário como essas representam algumas vulnerabilidades sérias à privacidade do usuário.

Vulnerabilidades graves para a privacidade do usuário

Invasão de privacidade patrocinada pelo Estado

Por exemplo, os governos precisam apenas emitir algum mandato legal ao Reddit para obter acesso às suas informações (o governo dos EUA, pelo menos, o Reddit indicou anteriormente uma falta de cooperação com outros governos na entrega de informações do usuário [3]), o que poderia ser motivado por tão pouco quanto coincidência. Por exemplo: você é suspeito de um crime que não tem nada a ver com você. É aceitável que pessoas infelizmente tenham sua privacidade violada?

A partir de 29 de janeiro de 2015, o Reddit nunca recebeu uma Carta de Segurança Nacional, uma ordem sob a Lei de Vigilância de Inteligência Estrangeira ou qualquer outra solicitação confidencial de informações do usuário. Se algum dia recebermos tal solicitação, procuraremos informar o público de sua existência. [fonte]

O Reddit incluiu a "declaração canária" em seu primeiro relatório de transparência, em 2014. Seu próximo relatório de transparência não incluía mais a “declaração canária” (talvez relacionado aos dois AMAs que Edward Snowden fez em 2015?). Nenhum de seus relatórios de transparência a seguir, na verdade. Embora haja alguma controvérsia sobre a veracidade legal de tais notificações, o CEO do Reddit, Steve Huffman respondeu à menção da remoção da “declaração canária”: "Mesmo com a "declaração canária”, estamos pisando em uma linha tênue." Tire suas próprias conclusões.

(Mesmo se o Reddit não controlasse esses dados, como /u/yishan aponta, depender de um sistema de armazenamento centralizado como o AWS (Amazon Web Services) significa que os dados ainda estão suscetíveis à apreensão ou inspeção do governo, porque os governos podem simplesmente ir para a Amazon.)

Claro, não temos que especular se o Reddit foi forçado a entregar as informações pessoais dos usuários aos governos - graças a outras informações de seus relatórios de transparência, sabemos disso com certeza. Em 2020, o ano do último relatório de transparência até agora, o Reddit cumpriu / entregou as informações do usuário ao governo dos Estados Unidos para: 256 intimações, 27 ordens judiciais, 86 mandados de busca e 1 rastreamento com o registrador com caneta/gravador de número discado; [4] bem como 60 solicitações de informações de usuários internacionais.

Número de solicitações de informações / mandatos do governo dos EUA com os quais o Reddit atendeu. Veja [5] para fontes.

Quando você acidentalmente entrega o banco de dados

Outra questão levantada por tais concentrações centralizadas de informações do usuário é um clássico com o qual muitos leitores infelizmente estão familiarizados: erro humano - se você considerar o uso da autenticação baseada em SMS como erro humano. Pare de usar a autenticação SMS!

Em 2018, o Reddit sofreu uma grave violação de dados: todos os dados do usuário desde o início do site em 2005 até 2007 vazaram, bem como alguns e-mails de usuários de 2018 (o que faria todos esses usuários). [fonte 1] [fonte 2]

A lição é clara: a entrega de dados pessoais é sempre um risco.

A centralização é o problema

Se os serviços não forem incentivados a coletar dados do usuário para outros fins que não a experiência do usuário, os serviços podem gerar menos informações pessoais. Se os serviços usarem armazenamento descentralizado, não precisaremos contar com a boa vontade contínua de gigantes da infraestrutura centralizada como a AWS. Os serviços descentralizados podem funcionar com os mesmos incentivos que seus usuários.

Ou os serviços centralizados podem continuar coletando dados pessoais. Os anunciantes podem se tornar mais eficazes na personalização de anúncios. A privacidade pode corroer tanto a ponto de se tornar irreconhecível, se é que continuará a existir. E algum dia, uma empresa como a Palantir pode decidir que você está agindo como um criminoso.

Notas de rodapé


0: [fonte] [arquivo]

1: além dos usuários do Reddit Gold, mas essa comparação não importa muito, porque os compradores do Reddit Gold não são capazes de expressar suas preferências de conteúdo para o Reddit tão eficazmente quanto os anunciantes

2: embora seja tecnicamente possível que todas as informações do usuário que o Reddit coleta sejam necessárias para que o Reddit forneça sua funcionalidade de não publicidade, este caso é invalidado considerando: "podemos dizer a um anunciante quantas pessoas viram seu anúncio."

3: consulte a seção com título "All of this leads to...", ponto 6. aqui

4: a cada ano que o registrador com caneta/gravador de número discado são relatados nos relatórios de transparência do Reddit, há exatamente um. Quem pode ser? 🤔

5: Relatórios de transparência do Reddit: 2020, 2019, 2018, 2017, 2016, 2015, 2014.